
- •Лекция 20 Факторный анализ факторный анализ
- •Основные понятия
- •Методика факторного анализа
- •Выделение факторов
- •Вращение
- •Интерпретация результатов
- •Для проведения факторного анализа предлагается методика, включающая в себя следующие этапы:
- •Пример 20.2. Компонентный анализ предприятия
- •Факторные нагрузки после вращения
- •Факторные нагрузки
- •Сравнение результатов методов компонентного и факторного анализа
- •По результатам компонентного и факторного анализа сделаем следующие выводы:
Для проведения факторного анализа предлагается методика, включающая в себя следующие этапы:
Сбор исходных статистических данных и подготовка корреляционной (ковариационной) матрицы.
Выделение общих скрытых факторов.
Вращение факторной структуры.
Содержательная интерпретация результатов факторного анализа.
Выделение общих скрытых факторов – это, прежде всего, выбор метода факторного анализа. Наиболее часто на практике используют методы: главных компонент (компонентный анализ) и главных факторов (факторный анализ).
В компонентном анализе поиск решения идет в направлении вычисления собственных векторов (факторов), а собственные значения характеризуют дисперсию (разброс) по факторам. Обычно под факторным анализом понимают применение метода главных компонент к редуцированной корреляционной матрице. Редуцированной корреляционной матрицей называют матрицу парных коэффициентов корреляции, в которой на главной диагонали вместо единиц указаны значения оценок общностей. Общность характеризует вклад данного признака в суммарную общность процесса.
Основное различие
двух методов факторного анализа состоит
в том, что в компонентном анализе
предполагается, что должна быть
использована вся изменчивость исходных
факторов xi
,
,
тогда как в факторном анализе используется
только изменчивость исходного фактора,
общего для других исходных факторов. В
большинстве случаев эти два метода
приводят к весьма близким результатам.
Компонентный анализ более предпочтителен
как метод сокращения данных, а фактороный
анализ лучше применять с целью определения
структуры данных.
Вращение факторной структуры – это “поворот” общих факторов в пространстве для достижения простой или близкой к простой структуры, в которой каждый исходный фактор характеризуется преобладающим влиянием какого-то одного общего выделенного фактора. Под простой факторной структурой понимается такая структура, в которой каждый исходный фактор имеет не нулевую нагрузку только на один общий фактор. Если общих факторов не меньше двух, то в простой матрице нагрузок каждая строка будет содержать только один ненулевой элемент, каждый столбец будет иметь несколько нулей и для каждой пары столбцов нулевые элементы не совпадают. Примером такой структуры может служить матрица
Такая идеальная структура для реальных данных трудно достижима, поэтому задача состоит в возможно большем приближении к такой структуре. Для получения простой структуры для реальных данных нужно вращать оси так, чтобы они проходили через скопление точек факторного пространства.
Выделяются два класса вращения: ортогональный и косоугольный. К ортогональным методам относятся методы “Varymax”, в котором максимизируется разброс квадратов факторных нагрузок по каждому фактору в отдельности, что приводит к увеличению больших нагрузок и уменьшению – маленьких нагрузок. “Quartymax” – это метод, в котором простая структура в отличие от предыдущего метода формируется для всех факторов одновременно. В некоторых случаях важнее получить простую структуру, чем сохранить ортогональность факторов. Для достижения этого используются аналогичные методы косоугольного поворота: “Oblymin” и “Oblymax”.
При интерпретации результатов факторного анализа сначала выделяют наибольшие факторные нагрузки в данном факторе. Для выделения можно использовать приемы, аналогичные выделению значимых коэффициентов корреляции, то есть оценивать факторные нагрузки, сравнивая их по величине с критическими значениями коэффициентов корреляции. Для подбора названий факторов нет формализованных приемов, он в основном производится по интуиции. В качестве предварительного варианта можно использовать имя переменной, которая вошла в фактор с наибольшей нагрузкой.
Компонентный анализ
Задача компонентного анализа заключается в том, чтобы по значениям исходных факторов выделить главные компоненты, которые являются ортогональными между собой и объясняют изменчивость исследуемого вероятностного объекта ,или нескольких объектов, с заданной достоверностью (как правило не менее, чем на 80% от общей изменчивости исследуемого объекта).
Зависимость между
исходными факторами xi
,
можно обнаружить с помощью диаграммы
рассеяния. Полученная путем подгонки
линия регрессии дает графическое
представление зависимости результативных
показателей эффективности объекта
исследования от влияющих на них исходных
факторов. Рассмотрим влияние на
результативный показатель эффективности
двух исходных факторов. Если определить
новую переменную на основе линии
регрессии, изображенной на диаграмме
рассеяния, то такая переменная будет
включать в себя наиболее существенные
черты двух исходных переменных. Итак,
фактически, можно сократить число
переменных и заменить две одной. Отметим,
что новый фактор (переменная), далее
называемый общим в действительности
является линейной комбинацией двух
исходных переменных.
В основном процедура выделения главных компонент подобна вращению, максимизирующему дисперсию (варимакс) исходного пространства переменных. Например, на диаграмме рассеяния можно рассматривать линию регрессии как ось X, повернув ее так, что она совпадает с прямой линейной регрессией. Этот тип вращения называется вращением, максимизирующим дисперсию, так как критерий (цель) вращения заключается в максимизации дисперсии (изменчивости) "новой" переменной (фактора) и минимизации разброса вокруг нее.
В том случае, когда имеется более двух переменных, можно считать, что они определяют трехмерное "пространство" точно так же, как две переменные определяют плоскость. Если имеется три переменные, то можете построить 3М диаграмму рассеяния. Для случая более трех переменных, становится невозможным наглядно представить точки на диаграмме рассеяния, однако логика вращения осей с целью максимизации дисперсии нового общего фактора остается прежней. После того, как найдена линия, для которой дисперсия максимальна, вокруг нее остается некоторый разброс данных. И процедуру естественно следует повторить. В компонентном анализе именно так и делается: после того, как первый общий фактор выделен, то есть, после того, как первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, общие факторы последовательно выделяются один за другим. Так как каждый после-дующий общий фактор выделяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то общие факторы оказываются независимыми друг от друга, другими словами, некоррелированными или ортогональными.
Сколько общих факторов следует выделять? Анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных. Отметим, что в процессе последовательного выделения общих факторов они включают в себя все меньше и меньше изменчивости. Решение о том, когда следует остановить процедуру выделения общих факторов, главным образом зависит от точки зрения на то, что считать малой "случайной" изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать количество общих факторов.
По критерию Кайзера рекомендуется отбирать факторы, с собственными значениями, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий является вероятно, наиболее широко используемым .
Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем . Можно изобразить собственные значения в виде простого графика. Кэттель предложил найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только "факториальная осыпь" – "осыпь" является геологическим термином, обозначающим обломки горных пород, скапливающиеся в нижней части скалистого склона.
Далее изложение материала по компонентному анализу даётся по книге Симчера В.М. Методы многомерного анализа статистических данных: учебное пособие.-М.: Финансы и статистика, 2008.-400с. Теория, стр.104-113. Пример стр.125-128.
Модель компонентного анализа в матричной форме
Z=A∙F, (20.2)
где Z – матрица стандартизированных значений исходных данных и их при-
знаков, размерностью (n×m);
A – матрица компонентных нагрузок, отражающая связь между главными компонентами и исходными признаками, размерностю (m×r);
F – матрица компонент размерностью (r×m);
n – количество признаков, характеризующих объект (объекты);
m – количество состояний объекта на заданных интервалах времени, или количество исследуемых вероятностных объектов;
r – количество компонент.
В частном случае количество компонент может совпадать с количеством признаков.
Матрица (20.2) представляется в виде следующей системы уравнений
=
.
.
(20.3)
z11=a11.f11+a12.f21+…+a1r.fr1;
z21=a21.f11+a22.f21+…+a2r.fr1;
znm=am1.f1m+am2.f2m+…+amr.frm.
1 2 3 4 5
Рис.20.2. Этапы преобразования матриц в компонентном анализе
Компонентный анализ проводится по следующим шагам.
Шаг 1. Строим матрицу состояний исследуемого объекта (исследуемых объектов).
X
=
.
(20.4)
Размерность
матрицы (n×m),
где xij
–
значение
i-го
признака j-го
состояния объекта (объектов);
;
.
Шаг 2. Вычислим средние значения и стандартные отклонения.
Оценка математического ожидания (среднего значения) вычисляется по формуле:
.
(20.5)
Оценка второго центрального момента ( дисперсии) вычисляется по формуле:
(20.6)
Оценка среднего квадратического отклонения (стандартного отклонения) вычисляется по формуле:
.
(20.7)
Шаг 3. Построим матрицу нормированных (стандартизированных) значений исходных данных.
Z
=
.
(20.8)
Стандартизированные значения вычисляются по формуле:
(20.9)
Отметим, что средние значения при стандартизированном представлении данных равны нулю, а стандартные отклонения единице.
Шаг 4. Построим матрицу коэффициентов линейной корреляции признаков R.
.
(20.10)
Подставив в (20.10) нули вместо средних значений в числителе и единицы вместо стандартных отклонений в знаменателе получим упрощенную формулу.
(20.11)
Отметим, что элементы главной диагонали матрицы (20.8) обращаются в единицы.
Таким образом, получили корреляционную матрицу.
R
=
.
Шаг
5. Построим матрицу
.
=
.
Шаг
6. Составим определитель матрицы
,
приравняем его нулю и найдём корни
полученного уравнения
;
.
Шаг
7. Построим матрицу собственных значений
.
.
Шаг 8. Найдём сумму вкладов, вносимую выделенными компонентами.
Шаг 9. Определим вклад выделенных компонент в общий вклад.
Шаг 10. Вычислим собственные вектора pij решением системы нормальных уравнений
. . . .
. . . .
. . . .
Шаг11. Построим матрицу компонентных нагрузок.
А=.
Отметим, что количество выделяемых компонент - r, как правило, меньше количества признаков-n. В частном случае r=n.
Шаг 12. Проведём вращение осей координат, так чтобы большие значения компонентных нагрузок увеличились, а небольшие уменьшились.
Шаг 13. Построим матрицу А-1
Шаг 14. Построим матрицу F=A-1∙Z.
Пример 20.1. Компонентный анализ
информационной системы
Провести компонентный анализ по результатам моделирования информационной системы
Решённые
задачи
.
.
.
РКК
Отказы,
если в памяти все места заняты
Рис.20.3. Структурная схема информационной системы
Построена матрица результатов изменения трех признаков по 8-ми вариантам. Система деградирует и на каждом варианте выходит из строя 1 компьютер.
В первом варианте функционируют 10 РК, в последнем-3. Выбор РК по правилу «первый свободный с наименьшим номером». В качестве признаков, характеризующих состояние информационной системы используются:
х1 - количество действующих ПК;
х2 - коэффициент недоиспользования ПК в долях от 1000;
х3 – среднее время между поступлением транзактов, изменяется по равно-
мерному закону в диапазоне от 80 до 120 ед. времени.
Время между поступлением транзактов и время их обслуживания подчиняются экспоненциальному закону. Среднее время обслуживания не меняется и равно 1600 единиц времени. Количество мест в очереди-12.
Время моделирования каждого варианта- 2000 единиц времени.
ПРОГРАММНАЯ МОДЕЛЬ
INITIAL X1,10
INITIAL X2,100
INITIAL X3,1600
INITIAL X4,3
INITIAL X5,8
REZ1 MATRIX ,3,8
REZ2 MATRIX ,3,8
REZ3 MATRIX ,3,8
REZ4 MATRIX ,3,3
REZ5 MATRIX ,3,3
REZ6 MATRIX ,3,3
REZ7 MATRIX ,3,3
REZ8 MATRIX ,3,3
PK STORAGE 10
BUFF STORAGE 12
VROGID QTABLE BUF,0,500,11
VRPREB TABLE M1,500,500,11
USTR TABLE P$VIB,0,1,15
GENERATE (EXPONENTIAL(2,0,X2))
GATE SNF BUFF,OTKAZ
ENTER BUFF
QUEUE BUF
TEST L X10,X1
SELECT NU VIB,1,X1
ENTER PK
SEIZE P$VIB
SAVEVALUE 10+,1
LEAVE BUFF
TABULATE USTR
DEPART BUF
ADVANCE (EXPONENTIAL(3,0,X3))
LEAVE PK
RELEASE P$VIB
SAVEVALUE 10-,1
TABULATE VRPREB
FINAL TERMINATE
OTKAZ TERMINATE
GENERATE ,,1,1
ASSIGN IG,200
ASSIGN YK,300
ASSIGN MOK,400
NACH ADVANCE 2000
ASSIGN 11+,1
MSAVEVALUE REZ1,1,P11,X1
SAVEVALUE 11+,X1
SAVEVALUE 21+,((X1)^2)
ASSIGN 12,X1
ASSIGN 1,0
SUM ASSIGN 1+,FR*12
LOOP 12,SUM
SAVEVALUE *IG,P1
ASSIGN IG+,1
ASSIGN 2,(P1/X1)
SAVEVALUE *YK,P2
ASSIGN YK+,1
ASSIGN 3,(1000-P2)
SAVEVALUE *MOK,P3
ASSIGN MOK+,1
MSAVEVALUE REZ1,2,P11,P3
SAVEVALUE 12+,P3
SAVEVALUE 22+,((P3)^2)
MSAVEVALUE REZ1,3,P11,X2
SAVEVALUE 13+,X2
SAVEVALUE 23+,((X2)^2)
SAVEVALUE 1-,1
SAVEVALUE 2,(80+20#RN9/1000)
TEST GE P11,8,NACH
ASSIGN 1,X4
CIK1 ASSIGN 2,X5
CIK2 ASSIGN 3,(P1+10)
ASSIGN 4,(P1+20)
ASSIGN 5,(P1+30)
ASSIGN 6,(P1+40)
ASSIGN 7,(P1+50)
SAVEVALUE *6,V$DEL1
DEL1 VARIABLE (X*3)/X5
SAVEVALUE *7,V$DEL2
DEL2 VARIABLE (X*4)/X5
SAVEVALUE *5,(SQR(X*7-(X*6)^2))
LOOP 2,CIK2
LOOP 1,CIK1
ASSIGN 11,X4
CIKL1 ASSIGN 12,X5
CIKL2 ASSIGN 13,(P11+40)
ASSIGN 15,(P11+30)
MSAVEVALUE REZ2,P11,P12,V$VICH1
VICH1 VARIABLE MX$REZ1(P11,P12)-X*13
MSAVEVALUE REZ3,P11,P12,V$VICH2
VICH2 VARIABLE (MX$REZ1(P11,P12)-X*13)/X*15
LOOP 12,CIKL2
LOOP 11,CIKL1
ASSIGN 11,X4
CIKL3 ASSIGN 12,X4
CIKL4 ASSIGN 13,X5
CIKL5 MSAVEVALUE REZ4+,P11,P12,V$VICH3
VICH3 VARIABLE (MX$REZ3(P11,P13)#MX$REZ3(P12,P13))/X5
LOOP 13,CIKL5
LOOP 12,CIKL4
LOOP 11,CIKL3
ASSIGN 1,X4
CIKL6 ASSIGN 2,X4
CIKL7 MSAVEVALUE REZ5,P1,P2,MX$REZ4(P1,P2)
TEST E P1,P2,NEM1
MSAVEVALUE REZ5,P1,P1,V$VICH4
VICH4 VARIABLE MX$REZ4(P1,P1)-3
NEM1 LOOP 2,CIKL7
LOOP 1,CIKL6
ASSIGN 1,X4
CIKL8 ASSIGN 2,X4
CIKL9 ASSIGN 3,X4
CIKL10 MSAVEVALUE REZ6+,P1,P2,V$VICH5
VICH5 VARIABLE MX$REZ4(P1,P3)#MX$REZ5(P3,P2)
LOOP 3,CIKL10
TEST E P1,P2,NEM2
ASSIGN SLED2+,(MX$REZ6(P1,P1)/2)
SAVEVALUE SLED2+,(MX$REZ6(P1,P1)/2)
NEM2 LOOP 2,CIKL9
LOOP 1,CIKL8
ASSIGN 1,X4
ZIKL6 ASSIGN 2,X4
ZIKL7 MSAVEVALUE REZ7,P1,P2,MX$REZ6(P1,P2)
TEST E P1,P2,ZEM1
MSAVEVALUE REZ7,P1,P1,V$VICH6
VICH6 VARIABLE MX$REZ6(P1,P1)-P$SLED2
ZEM1 LOOP 2,ZIKL7
LOOP 1,ZIKL6
ASSIGN 1,X4
ZIKL8 ASSIGN 2,X4
ZIKL9 ASSIGN 3,X4
ZIKL10 MSAVEVALUE REZ8+,P1,P2,V$VICH7
VICH7 VARIABLE MX$REZ4(P1,P3)#MX$REZ7(P3,P2)
LOOP 3,ZIKL10
TEST E P1,P2,NEM3
ASSIGN SLED3+,(MX$REZ6(P1,P1)/2)
SAVEVALUE SLED3+,(MX$REZ6(P1,P1)/2)
NEM3 LOOP 2,ZIKL9
LOOP 1,ZIKL8
TERMINATE 1
START 1
Построена матрица результатов изменения трех признаков по 8-ми вариантам. В качестве признаков используются:
х1 - количество действующих ПК;
х2 - коэффициент недоиспользования ПК в долях от 1000;
х3 – среднее время между поступлением транзактов, изменяется по равно-
мерному закону в диапазоне от 80 до 120 ед. времени.
Результаты моделирования представлены в виде матрицы REZ1:
1. По матрице REZ1 вычислены средние значения признаков:
и оценки стандартных
отклонений:
2. Результаты центрирования представлены в матрице REZ2:
3.Результаты стандартизирования представлены в матрице REZ3:
4. По REZ3 составляем корреляционную матрицу REZ4 (R):
=
.
Находим обобщающий определитель матрицы
,
где Е – единичная матрица:
=
=
.
Преобразуем представленный определитель в полином третьей степени:
Определим коэффициенты полинома.
7.1. Вычислим сумму диагональных элементов исходной матрицы R:
g1=tz|R|=1+1+1=3.
7.2. Вычислим
матрицу
RB1=R∙(R-g1∙E):
.
RB1=∙
=
.
Вычислим сумму диагональных элементов матрицы RB1:
g2=(tz|RB1|)/2=(-1,327-1,123-1,714)/2=-4,164/2=-2,082.
7.3. Вычислим матрицу RB2=R∙(RB1-g2∙E).
RB2=∙
=
Вычислим сумму диагональных элементов матрицы RB2:
g3=(tz|RB2|)/3=(0,241+0,241+0,241)/3=0.723/3=0,241.
Решение кубического уравнения
позволило найти
три корня
Сумма корней кубического уравнения:
К=2,035+0,820+0,144=2,999=3.
Вклады выделенных компонент составят:
к1=2,035/3=0,6785595; к2=0,82/3=0,2734244; к3=0,144/3=0,048016.
Вклад двух первых компонент в сумме составляет 0,6785595+0,2734244=0.9519839 и таким образом, третий компонент можно отбросить так как его вклад в общую изменчивость сравнительно невелик.
Вычислим собственные значения компонент.
Для вычисления собственных значений первого компонента требуется решить систему трёх нормальных уравнений.
Данная система уравнений имеет бесчисленное количество возможных решений, все они обеспечивают одинаковые пропорции между корнями. Найдём одно из возможных решений при р31=1. Оставим для вычислений два нижних уравнений и умножив последнее на -3,9502487 получим.
Откуда р21=4,5825074/2,9864228=1,534469.
р11=(1,035-0,494∙1,5344469)/0,201=1,3780263.
Для вычисления собственных значений второго компонента требуется решить систему нормальных уравнений
Решим данную систему аналогично предыдущему решению, приняв р32=1, удалив первое уравнение и умножив последнее на -3,9502487
р22=(-0,494+0,711044766)/(0,18-1,9514228)=-0,1225256;
р12=(-0,18-0,494∙(-0,1225256))/0,201=-0,59439.
Для вычисления собственных значений третьего компонента решим систему нормальных уравнений аналогично предыдущему.
Пусть р33=1. Tребуется решить следующую систему уравнений.
р23=(-0,494+3,3814128)/(0,856-1,9514228)=-2,6358407;
р13=(0,494∙2,6358407-0,856)/0,201=2,2194293.
Таким образом, вычислив все элементы построим матрицу А:
А= .
Вывод. На основе вычисленных компонентных нагрузок отмечаем неоднородность связи компонент с исходными признаками. Первая компонента
имеет существенную корреляционную связь с первым и вторым признаками. Назовём её внутренней структурной компонентой. Вторая компонента имеет существенную корреляционную связь с третьим признаком. Назовём её компонентой внешней среды. Третья компонента имеет несущественную корреляционную связь со всеми тремя признаками и поэтому её можно не учитывать при проведении статистического анализа.
Проведём обращение матрицы коэффициентов и построим матрицу А-1
Убедимся, что результатом умножения исходной матрицы А на обратную матрицу А-1 является единичная матрица
Ввиду того, что ошибка в вычислении единичной матрицы не превышает 0,0000003 т.е. 0,00003% будем считать результаты вычислений приемлемыми.
Построим матрицу значений вычисленных компонент F=A-1 ∙Z.
Для сравнения ещё раз приведём исходную матрицу Z.
Ввиду того, что первые два выделенных компонента объясняют более 95% изменчивости объекта исследования, то третий компонент можно отбросить и тогда матрица А принимает следующий вид:
А=
.
Так как преобразованная матрица А неквадратная, то для вычисления матрицы F используется формула F=(AT∙A)-1∙(AT∙Z).
Вычислим транспонированную матрицу AT.
Вычислим произведение матриц AT ∙A.
Вычислим обратную матрицу (AT ∙A)-1.
Вычислим произведение матриц AT ∙Z.
Построим матрицу выделенных компонент F=(AT ∙A)-1 (AT ∙Z).
Для дальнейшего статистического анализа объекта – информационной системы вместо трёх исходных факторов можно использовать два выделенных компонента и таким образом сократить размерность представления объекта и
соответственно объём производимых вычислений. Применение компонентного
анализа продемонстрировано на сравнительно несложном примере и поэтому проведённое сокращение кажется небольшим. На задачах со значительным количеством объектов и их признаков можно добиться существенного снижения размерности, что позволит сократить объём производимых вычислений и повысить степень понимания получаемых результатов статистического анализа.
Графическая интерпретация поворота осей координат для трёх координат представлена на рис. 20.4 −20.6.
F21 F2
Рис.20.4. Поворот осей координат на угол в 0.46 радиан (26 градусов 21 минуту) для первой координаты
Рис.20.5. Поворот осей координат на угол в 0.46 радиан (26 градусов 21 минуту) для второй координаты
Рис.20.6. Поворот осей координат на угол в 0.46 радиан (26 градусов 21 минуту) для третьей координаты
Таким образом, с помощью поворота осей координат преобразовали
матрицу
А=
в матрицу
А=
.
Матрицу выделенных компонент можно вычислить аналогично рассмотренному выше по формуле: F=(AT ∙A)-1 (AT ∙Z).
При повороте осей координат коэффициенты матрицы рассчитывались по формулам:
ai=ci·cos(αi-φ); bi=ci·sin(αi-φ); ci=ai2+bi2.
I=1,2,3.
При повороте осей координат на φ=0,49 (28 градусов) получили следующую матрицу:
А=
.
Для трёх полученных матриц А вычислим отношения существенных средних значений факторных нагрузок к несущественным средним значениям.
((0,858+0,955+0,774)/3)/((0,460+0,095+0,622)/3)=0,862/0,392;
((0,969+0,917+0,955)/3)/((0,090+0,284+0,272)/3)=0,947/0,215;
((0,970+0,876+0,974)/3)/((0,070+0,418+0,175)/3)=0,940/0,221.
Таким образом поворот осей координат на 0.46 радиана даёт лучший результат и по средним значениям существенных факторных нагрузок и по средним значениям несущественных факторных нагрузок.
Для вычисления элементов матрицы главных компонент, обозначив
F=GLKOM, A-1=OBR, Z=REZ3 составим программу вычислений на языке GPSS W.
GLKOM MATRIX ,3,8
OBR MATRIX ,3,3
REZ3 MATRIX ,3,8
GLUK VARIABLE MX$OBR(P3,P2)#MXREZ3(P2,P3)
INITIAL X1,3
INITIAL X2,8
INITIAL MX$...
INITIAL MX$...
.
.
.
INITIAL MX$...
GENERATE ,,1,1
ASSIGN 1,X1
KOMP1 ASSIGN 2,X2
KOMP2 ASSIGN 3,X1
KOMP3 MSAVEVALUE GLKOM+,P1,P2,V$GLUK
LOOP 3,KOMP3
LOOP 2,KOMP2
LOOP 1,KOMP1
TERMINATE 1
START 1
Факторный анализ
По определению
общность
переменнойiравна сумме квадратов нагрузок
общих факторов этой переменной
.
Общности являются диагональными
элементами редуцированной корреляционной
матрицы. В случае использования
корреляционной матрицы общности могут
принимать значения от 0 до 1. Имеется
несколько различных способов
предварительной оценки общности.
Наиболее
часто используются следующие два метода .
Способ наибольшей корреляции. В этом случае общность переменной приравнивается наибольшему коэффициенту корреляции данной переменной с остальными и на главной диагонали редуцированной корреляционной матрицы записывается этот коэффициент без учета знака. Этот способ оценки общностей рекомендуется при большом числе переменных, порядка 20.
Способ квадрата коэффициента множественной корреляции. Для общности справедливо неравенство
;
,
где
–
квадрат коэффициента множественной
корреляции (КМК), который известен из
регрессионного анализа, как коэффициент
множественной детерминации (КМД).
Значение КМД является мерой дисперсии
переменной, общей со всеми переменными
исследуемого множества, в то время как
общность является мерой дисперсии i
переменной, обусловленной общими для
нескольких переменных факторами.
Значения КМК для каждой переменной
удобно вычислять с помощью обратной
корреляционной матрицы по формуле:
;
,
где – диагональный элемент матрицы обратной
корреляционной матрице.
Выбор КМК в качестве оценки общности в настоящее время наиболее теоретически обоснован и рекомендуется чаще всего.