Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4ПМ_Б_Комп_Модел_Власова / Теоретический материал / Компютерное моделирование_Лекции.doc
Скачиваний:
93
Добавлен:
28.03.2016
Размер:
1.95 Mб
Скачать

8.2. Вращение факторов.

Вращение факторов может производиться разными способами. Наиболее часто это вращение осуществляется таким образом, чтобы как можно большее число факторных нагрузок стало нулями, и каждый фактор по возможности описывал группу сильно коррелированных признаков.

Также можно вращать факторы до тех пор, пока не получатся результаты, поддающиеся содержательной интерпретации. Можно, например, потребовать, чтобы один фактор был нагружен преимущественно признаками одного типа, а другой — признаками другого типа. Или, скажем, можно потребовать, чтобы исчезли какие-то трудно интерпретируемые нагрузки с отрицательными знаками.

Нередко исследователи идут дальше и рассматривают прямоугольную систему факторов как частный случай косоугольной, то есть ради содержания жертвуют условием некоррелированности факторов.

8.3. Применение факторного анализа.

Известно большое количество методов факторного анализа (ротаций, максимального правдоподобия и др.). Нередко в одном и том же пакете программ анализа данных реализовано сразу несколько версий таких методов и у исследователей возникает правомерный вопрос о том, какой из них лучше. В этом вопросе наше мнение совпадает с /Александров В. В. и др., 1990/, где утверждается, что практически все методы дают весьма близкие результаты. Там же приводятся слова одного из основоположников современного факторного анализа Г. Хармана: «Ни в одной из работ не было показано, что какой-либо один метод приближается к "истинным" значениям общностей лучше, чем другие методы... Выбор среди группы методов "наилучшего" производится в основном с точки зрения вычислительных удобств, а также склонностей и привязанностей исследователя, которому тот или иной метод казался более адекватным его представлениям об общности» /Харман Г., 1972, с. 97/. У факторного анализа есть много сторонников и много оппонентов. Но, как справедливо заметил В. В. Налимов: «...У психологов и социологов не оставалось других путей, и они изучили эти два приема (факторный анализ и метод главных компонент, — В. Д.) со всей обстоятельностью» /Налимов В. В., 1971, с. 100/. Для более подробного ознакомления с факторным анализом и его методами может быть рекомендована литература /Лоули Д., и др., 1967; Харман Г., 1972; Айвазян С. А. и др., 1974; Иберла К., 1980/.

8.4. Некоторые результаты факторного анализа

Факторный анализ экономических показателей.Экономические показатели, значения которых определяются ежемесячно либо ежеквартально, часто называют текущими показателями. Госкомстат России публикует их в ежемесячном бюллетене "Социально-экономическое положение России". Исследователя интересуют связи между различными показателями - этот вопрос является одной из главных целей их экономического исследования.

Задача факторного анализа состоит в представлении наблюдаемых показателей в виде линейной комбинации относительно небольшого числа гипотетических, непосредственно не наблюдаемых параметров - факторов.

Определение факторов и их числовых значений означает формирование гипотезы, которую необходимо содержательно интерпретировать. В настоящей работе методами факторного анализа исследуются ряды ежемесячных значений некоторых важнейших макропоказателей за 1996-1999 годы. Этот период характеризуется интенсивными изменениями показателей, что усиливает значимость и интерес их изучения.

Для удобства интерпретации полученных результатов желательно, чтобы экономическое содержание исследуемых показателей было приблизительно "одноуровневым", то есть они не относились бы друг к другу как общее к частному. Именно поэтому в состав анализируемых параметров не включен показатель валового внутреннего продукта, поскольку он по сравнению с большинством других показателей воплощает в себе большую общность. Показатели должны быть независимы. Например, если один показатель характеризует изменение цен, то остальные не должны зависеть от инфляции.

В таблице 1 приведены значения отобранных для анализа показателей за 46 месяцев (с января 1996г. по сентябрь 1999г.), взятые по отношению к значениям соответствующих показателей в декабре 1995 года.

Для удобства вычислений значения всех показателей за декабрь 1995 года приняты за единицу, а не за 100%, как это обычно принято. То есть числа в таблице 1 показывают, во сколько раз величина показателя в текущем месяце превышает его величину в декабре 1995 года.

 

 

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

янв.96

0,907

1,030

0,256

0,785

1,795

1,008

1,000

1,032

1,013

1,081

фев.96

0,924

1,055

0,261

0,977

1,767

0,981

1,000

1,074

1,033

1,056

мар.96

0,994

1,047

0,319

0,896

1,227

1,019

0,750

1,104

1,052

0,958

апр.96

0,955

1,054

0,327

1,246

2,256

0,944

0,750

1,135

1,060

0,963

май.96

0,870

1,047

0,317

0,896

1,733

1,125

0,750

1,160

1,079

1,218

июн.96

0,863

1,074

0,344

0,778

1,599

1,135

0,750

1,178

1,095

1,649

июл.96

0,880

1,116

0,339

0,917

2,174

1,017

0,750

1,192

1,115

2,302

авг.96

0,873

1,113

0,342

0,930

2,687

1,079

0,688

1,201

1,133

2,162

сен.96

0,898

1,135

0,361

0,689

2,777

1,161

0,500

1,198

1,168

2,733

окт.96

0,964

1,148

0,378

0,759

2,766

1,262

0,500

1,202

1,178

2,485

ноя.96

0,905

1,135

0,516

0,739

2,499

1,269

0,375

1,217

1,191

2,814

дек.96

0,981

1,120

0,772

0,760

1,274

1,102

0,375

1,239

1,203

2,868

янв.97

0,889

1,158

0,290

0,817

4,951

1,185

0,300

1,257

1,214

2,909

фев.97

0,917

1,146

0,309

0,842

4,014

1,030

0,300

1,287

1,229

4,053

мар.97

0,973

1,148

0,351

1,108

3,642

1,015

0,263

1,306

1,239

4,928

апр.97

0,943

1,148

0,342

0,826

3,157

0,887

0,263

1,325

1,250

4,954

май.97

0,871

1,151

0,347

0,821

3,313

0,944

0,225

1,338

1,258

5,042

июн.97

0,861

1,148

0,422

1,220

5,416

0,932

0,225

1,350

1,260

5,476

июл.97

0,908

1,171

0,430

0,950

4,345

0,940

0,150

1,365

1,262

6,116

авг.97

0,923

1,181

0,457

0,746

3,116

0,922

0,150

1,378

1,266

7,159

сен.97

0,934

1,178

0,506

0,846

4,977

0,907

0,150

1,376

1,273

7,777

окт.97

1,004

1,204

0,466

0,850

4,322

0,922

0,150

1,372

1,279

8,347

ноя.97

0,976

1,170

0,500

0,703

3,777

1,011

0,131

1,374

1,285

8,041

дек.97

1,035

1,186

0,800

0,741

1,904

0,797

0,175

1,383

1,292

6,093

янв.98

0,915

1,189

0,277

0,972

6,251

0,758

0,175

1,396

1,301

6,896

фев.98

0,929

1,197

0,295

0,590

6,315

0,699

0,175

1,417

1,316

5,150

мар.98

0,999

1,208

0,324

1,049

5,392

0,755

0,244

1,429

1,326

5,420

апр.98

0,954

1,212

0,316

0,912

5,748

0,750

0,188

1,439

1,333

5,552

май.98

0,847

1,201

0,329

0,868

5,657

0,816

0,188

1,444

1,339

5,437

июн.98

0,837

1,217

0,395

0,991

6,158

0,894

0,938

1,451

1,346

2,954

июл.98

0,826

1,237

0,408

0,913

6,002

0,880

0,500

1,452

1,353

2,440

авг.98

0,816

1,237

0,437

0,713

5,630

0,911

0,375

1,455

1,362

2,425

сен.98

0,794

1,225

0,466

0,690

5,853

1,614

0,375

1,508

1,726

1,048

окт.98

0,888

1,207

0,433

0,918

5,014

1,693

0,375

2,088

3,508

0,671

ноя.98

0,885

1,167

0,465

0,938

4,321

1,611

0,375

2,181

3,496

0,978

дек.98

0,966

1,169

0,708

0,764

2,011

1,672

0,375

2,306

3,904

1,117

янв.99

0,894

1,180

0,311

0,654

4,260

1,190

0,375

2,573

4,509

1,006

фев.99

0,901

1,180

0,340

0,829

4,293

1,292

0,375

2,789

4,934

0,945

мар.99

1,003

1,162

0,377

0,912

3,346

1,366

0,375

2,904

4,991

1,219

апр.99

0,960

1,166

0,373

0,767

2,493

1,492

0,375

2,985

5,279

1,215

май.99

0,898

1,153

0,397

0,889

2,746

1,387

0,375

3,075

5,290

1,507

июн.99

0,913

1,137

0,490

0,736

2,065

1,275

0,375

3,142

5,336

1,453

июл.99

0,932

1,135

0,511

0,679

1,926

1,482

0,344

3,202

5,288

1,924

авг.99

0,947

1,153

0,520

0,671

2,045

1,574

0,344

3,292

5,282

1,687

сен.99

0,954

1,147

0,523

0,657

2,014

1,582

0,344

3,331

5,404

1,527

Таблица 1. Значения исходных показателей

(Вопросы статистики, 2000, №2.)

Каждый из 10 показателей представляет собой некоторый экономический показатель обозначающий:

Y1 - индекс промышленного производства, характеризующий изменение его физического объема по сравнению с базисным месяцем. В качестве базисного месяца выбран декабрь 1995 года.

Y2 - индекс изменения по сравнению с базисным месяцем соотношения между кредиторской и дебиторской задолженностью промышленных предприятий

Y3 - индекс физического объема инвестиций в основной капитал.

Y4 - индекс изменения по сравнению с базисным месяцем соотношения между расходами и доходами федерального бюджета,

Y5-индекс изменения по сравнению с базисным месяцем соотношения между государственным внутренним долгом и месячными доходами федерального бюджета.

Y6- индекс изменения по сравнению с базисным месяцем соотношения между экспортом товаров из России и их импортом в Россию,

Y7 - отношение ставки рефинансирования Центрального банка России в начале текущего месяца к её уровню в начале декабря 1995 года.

Y8 - индекс потребительских цен текущего месяца по отношению к декабрю 1995 года.

Y9 - отношение официального курса доллара США в конце текущего месяца к его курсу в начале декабря 1995 года.

Y10 - сводный фондовый индекс "РТС-Интерфакс", который является одним из индексов рынка ценных бумаг в Российской Федерации.

Таким образом, исходным материалом для проведения факторного анализа является матрица Y, которая получается из таблицы 1 путем её транспонирования.

В результате транспонирования столбцы таблицы 1 становятся строками матрицы Y, имеющей порядок 10*45. Любой элемент этой матрицы Yij - это значение i-го показателя за j-й месяц.

Нормируем матрицу Y, превращая ее в матрицу Z порядка 10*45, элементы которой определяются по формуле:

zij

=

yij- yi

(8.4.1)

si

где yi - среднее значение показателя yi,

Стандартное отклонение показателя yi. вычисляется по формуле

si

=

Sqrt

(

1

Sumj=1...45

(yij- yi)2

)

(8.4.2)

n - 1

Очевидно, что средние значения всех переменных Zi равны 0, а все их дисперсии равны 1, то есть

1

Sumj=1...45

zij

= 0

и

1

Sumj=1...45

zij2

= 1

(3)

n

n - 1

Например, графики исходных и нормированных значений показателя Y2 выглядят так:

 

Рис. 1

 

В отличие от исходных показателей, нормированные величины не зависят от единиц измерения; они колеблются вокруг одной и той же (нулевой) средней, что значительно упрощает анализ.

Несложно доказать, что при умножении (по правилам матичной алгебры) матрицы Z на транспонированную матрицу Z' и на число 1/(n - 1) получается корреляционная матрица R, содержащая коэффициенты корреляции между нормированными показателями Zi, то есть

1/(n - 1)ZZ' = R.

 

 

Z1

Z2

Z3

Z4

Z5

Z6

Z7

Z8

Z9

Z10

Z1

1,00

-0,15

0,31

-0,01

-0,40

-0,05

-0,25

0,13

0,13

0,26

Z2

-0,15

1,00

0,22

-0,16

0,77

-0,05

-0,65

0,19

0,13

0,39

Z3

0,31

0,22

1,00

-0,32

-0,27

0,30

-0,32

0,24

0,21

0,10

Z4

-0,01

-0,16

-0,32

1,00

0,19

-0,31

0,20

-0,32

-0,30

0,08

Z5

-0,40

0,77

-0,27

0,19

1,00

-0,34

-0,42

-0,16

-0,21

0,41

Z6

-0,05

-0,05

0,30

-0,31

-0,34

1,00

0,08

0,67

0,72

-0,66

Z7

-0,25

-0,65

-0,32

0,20

-0,42

0,08

1,00

-0,20

-0,14

-0,65

Z8

0,13

0,19

0,24

-0,32

-0,16

0,67

-0,20

1,00

0,99

-0,40

Z9

0,13

0,13

0,21

-0,30

-0,21

0,72

-0,14

0,99

1,00

-0,47

Z10

0,26

0,39

0,10

0,08

0,41

-0,66

-0,65

-0,40

-0,47

1,00

Таблица 2. Коэффициенты корреляции между

нормированными исходными показателями

 

Целью факторного анализа является представление величины zij в виде линейной комбинации нескольких гипотетических переменных или факторов, то есть так: zij = ai1 p1j + ai2 p2j +…+ air prj (5). Здесь aij являются постоянными коэффициентами, которые надо определить; p1j – prj - значениями факторов за j-й месяц. Формула (5) в матричной форме имеет вид Z=AP (6), где Z - матрица порядка 10*45 нормированных исходных показателей; - матрица порядка 10*r, называемая факторным отображением (r - количество факторов), P - матрица порядка r*45 значений всех факторов для всех месяцев. Элементы aij матрицы А называются факторными нагрузками.

Подставив (6) в (4), получим

R=1/(n - 1)APP'A'  (7).

По аналогии с формулой (4) можно утверждать, что выражение

1/nPP'= С

- является корреляционной матрицей, отражающей связи между факторами, тогда

R=ACA'.

Если принять условие о некоррелированности факторов, т.е.

С=I, то R=AA'  (8).

Если исходные показатели нормированы, факторы нормированы и некоррелированы, то справедливо равенство:

si2 = ai12 + ai22 + ... + aiq2 = 1    (9)

Т.е. сумма квадратов всех нагрузок одного показателя равна дисперсии его нормированных величин, которая (согласно формуле 3) равна единице.

Это важное утверждение выводится путем несложных преобразований. Зная матрицу R, можно, решив систему уравнений (8), определить матрицу A.

Точное решение имеет место в том случае, когда R и A матрицы одного порядка, то есть количество факторов равно количеству наблюдаемых показателей.

Если факторов меньше, чем показателей, то достигается та или иная степень приближения к точному решению. Цель состоит в том, чтобы посредством относительно небольшого числа факторов воспроизвести большую часть дисперсии показателей.

Существует несколько методов выделения факторов. Более простым с теоретической точки зрения является метод главных компонент, который в случае выделения четырех факторов приводит к следующему результату.

 Таблица 3

 

Факторные нагрузки (матрица А)

Сумма квадратов нагрузок

Фактор 1

Фактор 2

Фактор 3

Фактор 4

факторы 1-3

факторы 1-4

Z1

0,13

0,14

-0,82

0,41

0,72

0,88

Z2

-0,20

0,86

0,34

-0,06

0,90

0,90

Z3

0,34

0,43

-0,51

-0,34

0,56

0,68

Z4

-0,42

-0,34

0,11

0,67

0,31

0,75

Z5

-0,56

0,52

0,59

0,09

0,94

0,94

Z6

0,87

0,06

0,18

-0,06

0,80

0,80

Z7

0,16

-0,89

0,18

-0,10

0,85

0,86

Z8

0,83

0,39

0,16

0,29

0,86

0,95

Z9

0,87

0,32

0,17

0,29

0,88

0,97

Z10

-0,71

0,51

-0,37

0,05

0,90

0,90

 Выделенные четыре фактора обусловливают более 80 процентов дисперсии всех показателей, кроме Z3 и Z4 (это следует из формулы 9).

Если бы факторов было только 3, то дисперсия показателей воспроизводилась бы хуже: на 56 процентов для Z3 и на 31 процент для Z4.

Однако в случае трех факторов их интерпретация (особенно геометрическая) значительно упрощается. Поэтому с целью некоторого упрощения целесообразно ограничиться изучением трех факторов, а в дальнейшем при необходимости можно вернуться к рассмотрению четвертого фактора. Поскольку факторы некоррелированы (ортогональны), их можно представить в виде трех ортогональных координатных осей.

Если на этих осях отметить значения факторных нагрузок, соответствующих каждому из 10 нормированных показателей, то получим 10 точек, каждая из которых характеризует одну из строк матрицы А. В результате, имеем следующий графический образ этой матрицы:

.

Рис. 8. 2

 Система уравнений (8) при заданном числе факторов имеет бесконечно много эквивалентных решений, дающих одинаковую степень воспроизведения дисперсии каждого показателя (то есть одинаковую сумму квадратов факторных нагрузок).

Различные решения получаются при вращении системы координат вокруг ее центра. Факторные нагрузки при этом изменяются, но остается неизменной сумма их квадратов.

Вращая систему координат, необходимо искать наиболее просто интерпретируемое решение. А именно, надо найти такое положение системы координат, которое бы для каждой строки (или столбца) матрицы А увеличивало бы большие факторные нагрузки и уменьшало малые.

Метод вращения "квартимакс" обеспечивает выполнение этой операции для строк матрицы А, а метод "варимакс" - для столбцов этой матрицы.

В таблице 3 первый из выделенных факторов обусловливает более 65 процентов дисперсии четырех показателей (Z6, Z8, Z9), второй фактор - двух показателей (Z2, Z7), третий фактор - одного показателя (Z1).

Высокая нагрузка первого фактора вообще характерна для метода главных компонент. Для улучшения интерпретации было бы желательно несколько выровнять нагрузки различных факторов, осуществив вращение системы координат.

В результате вращения методом варимакс матрица А и ее графический образ принимают следующий вид. 

Рис. 8. 3

 

 

Фактор 1

Фактор 2

Фактор 3

Сумма квадратов нагрузок

Z1

0,06

-0,12

0,84

0,72

Z2

-0,16

0,93

-0,07

0,90

Z3

-0,30

0,14

0,67

0,56

Z4

0,46

-0,13

-0,29

0,31

Z5

0,21

0,82

-0,48

0,94

Z6

-0,87

-0,21

-0,01

0,80

Z7

0,06

-0,81

-0,43

0,85

Z8

-0,92

0,10

0,11

0,86

Z9

-0,93

0,02

0,09

0,88

Z10

0,60

0,61

0,39

0,90

Таблица 4. Факторные нагрузки

 

После вращения количество высоких нагрузок первого и второго фактора выровнялось, что облегчает их интерпретацию. Первый фактор в основном обусловливает дисперсию Z6, Z8 и Z9, то есть индекс соотношения между экспортом и импортом товаров, индексы потребительских цен и официального курса доллара США. Обобщая, можно сказать, что этот фактор отражает паритет российской экономики по отношению к остальному миру.

Второй фактор обусловливает главным образом дисперсию Z2, Z5 и Z7, то есть индекс соотношения между кредиторской и дебиторской задолженностью промышленных предприятий, индекс соотношения между государственным внутренним долгом (по ГКО и ОФЗ) и месячными доходами федерального бюджета, индекс ставки рефинансирования Центрального банка России. Этот фактор характеризует степень активности процесса заимствования средств.

Третий фактор выражает уровень материального производства, поскольку он в значительной степени обусловливает значения индексов промышленного производства и инвестиций в основной капитал (Z1 и Z3).

Для получения формулы, позволяющей определить числовые значения факторов, надо обе стороны выражения (6) умножить на А'и решить его относительно Р. Решение имеет вид

P = (A'A)-1A'Z  (10).

Определим нормированные значения факторов и построим их графики. Последние представлены ниже. 

Рисунок 4

Из графика видно, что в основе анализируемой системы показателей лежат три взаимосвязанные тенденции:

- неустойчивость паритета российской экономики по отношению к остальному миру в 1996-1997 годах, его снижение в 1998 году и некоторое замедление этого процесса в 1999 году;

- рост склонности к заимствованию средств до начала 1998 года и ее постепенное снижение в дальнейшем;

- неустойчивость материального производства с его некоторым ростом во второй половине 1997 года, резким спадом в 1998 году и стабилизацией в 1999 году.

Этот фактор в значительной степени отражает также присущие производству сезонные колебания, в частности, всплески промышленного производства в марте и декабре, активизацию строительной деятельности к концу года.

Добавление четвертого фактора не приводит к значительным изменениям значений первых трех факторов (в этом легко убедиться, выполнив все вышеописанные операции для случая четырех факторов). Это говорит о том, что выделенные факторы достаточно полно характеризуют современные тенденции текущих экономических показателей.

Л и т е р а т у р а

  1. Гмурман. В.Е. Теория вероятностей и математическая статистика. Москва, «Высшая школа» 1997г.

  2. И.И. Елисеева, М.М. Юзбашев. Общая теория статистики. Москва, «Финансы и статистика» 1998.

  3. И.А.Власова. Статистический анализ экспериментальных данных на ЭВМ. СамГу,1986

  4. Методы многомерной статистики . под ред. Сошниковой. Москва, «Высшая школа», 2002 Некоторые результаты факторного анализа И.С.Ульянов, канд. экон. наук, Госкомстат России.