
Metodichka_lab_Ekonometria
.pdf
Таблица 3.3
Показатели отчета на рис. 3.4
Адрес |
Название показателя |
|
ячейки |
||
|
||
1 |
2 |
|
B4 |
коэффициент множественной |
|
корреляции, индекс |
||
|
корреляции |
|
B5 |
коэффициент детерминацииR2 |
|
|
|
|
B6 |
скорректированный |
|
коэффициент детерминации |
||
|
||
B7 |
среднеквадратическое |
|
отклонение от модели |
||
|
||
|
|
|
B8 |
количество наблюдений |
|
B12 |
степень свободы регрессии |
|
B13 |
степень свободы остатка |
|
B14 |
всего степеней свободы |
|
C12 |
сумма квадратов отклонений |
|
регрессии |
||
|
||
C13 |
сумма квадратов отклонений |
|
остатков |
||
|
||
C14 |
полная сумма квадратов |
|
отклонений |
||
|
||
D12 |
сумма квадратов отклонений |
|
регрессии на одну степень |
||
|
свободы |
|
D13 |
сумма квадратов отклонений |
|
остатков на одну степень |
||
|
свободы |
|
E12 |
фактическое значение |
|
F -статистики |
||
|
||
|
табличное значение |
|
F12 |
F -статистики при уровне |
|
|
значимости α |
|
B17 : B18 |
коэффициенты уравнения |
|
|
регрессии |
Обозначение, расчетная формула
3
|
|
|
|
R = |
|
|
R2 |
|
|
|
|
|
|
|
||||
|
|
|
|
n |
|
|
|
|
|
|
|
n |
(yˆi − |
|
)2 |
|||
|
|
|
∑ei2 |
|
|
|
|
|
|
∑ |
|
|||||||
R2 =1− |
|
|
|
|
|
|
y |
|||||||||||
|
i=1 |
|
|
|
|
|
= |
i=1 |
|
|
|
|
|
|||||
n |
|
|
|
|
|
|
n |
|
|
|
|
|
||||||
|
|
|
∑(yi − |
y |
)2 |
|
|
|
∑ |
(yi − |
y |
)2 |
||||||
|
|
|
i=1 |
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
2 =1−(1− R2 ) |
n −1 |
|
||||||||||||||
|
R |
|||||||||||||||||
|
n −m −1 |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
n |
||||
Se = Se2 = |
|
|
|
|
|
|
∑ei2 |
|||||||||||
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
n − m −1 i=1 |
|||||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
n − m −1 |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
n −1 |
|
|
|
|
|
|
|
|
|
||||
|
SSR |
= |
|
|
|
ˆ |
|
− |
y) |
2 |
|
|
|
|||||
|
|
∑( yi |
|
|
|
|
|
|
|
|||||||||
|
SSE |
= |
∑ |
|
( yi |
− |
ˆ |
|
2 |
|
|
|
||||||
|
|
|
|
|
yi ) |
|
|
|
|
SST = ∑( yi − y)2
SSR / n
|
SSE /(n − m −1) |
||||
F |
|
= |
|
R2 |
(n − 2) |
|
1− R2 |
||||
факт. |
|
|
Fтабл. (α, v1 = m, v2 = n − m −1)
aˆ j , j =1,2, (3.7) – (3.9)
39

Продолжение таблицы 3.3
|
1 |
2 |
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
C17 |
: C18 |
стандартные ошибки |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
коэффициентов уравнения |
Saˆ j , |
|
j =1,2, (3.13), (3.14) |
||||||||||||||
|
|
регрессии |
|
||||||||||||||
D17 : D18 |
фактические значения |
taˆ |
j |
|
= aˆ j |
Saˆ |
j |
, j =1,2 |
|||||||||
|
|
t -статистик |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
B25 |
: B34 |
предсказанное (теоретическое) |
yˆ |
|
|
= aˆ |
|
+ aˆ |
x , i = |
|
|
|
|||||
i |
0 |
1,10 |
|||||||||||||||
|
|
значение y |
|
|
|
|
1 |
|
i |
|
|
|
|
|
|||
C25 |
:C34 |
отклонения по модели |
e |
|
= y |
|
− yˆ |
|
, i = |
|
|
|
|||||
|
i |
i |
1,10 |
||||||||||||||
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
На основании результатов расчетов по пунктам 1) – 6) лабораторной работы 3 средствами программы MS Excel (рис. 3.1, табл. 3.2) сделаем следующие выводы.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 3.4 |
|
|
Реализация в MS Excel формул на рис. 3.4 |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Адрес ячейки |
|
|
Формула |
Реализация в MS Excel |
||||||||||||||
E25: E34 |
|
|
|
Ai = |
|
|
ei |
|
|
|
E25 = ABS(C25/D25) |
|
||||||
|
|
|
|
|
||||||||||||||
|
|
|
|
|
||||||||||||||
|
|
|
|
yi |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
1 |
n |
|
ei |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
||||||||||||
E35 |
|
A = |
∑ |
|
|
|
|
100 % |
= СРЗНАЧ(E25 : E34) |
|
||||||||
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
n i=1 yi |
|
|
3.3 Построение модели линейной парной регрессии
Уравнение выборочной линейной регрессии Y на X имеет вид
yˆ =1,4 +1,16x .
На основании построенной модели можно сделать следующие экономические выводы: при увеличении торговой площади магазина на
1 тыс. м2 объем реализации магазина увеличивается в среднем на 1,16 млн грн.
3.4 Проверка качества модели
На основании значения коэффициента детерминации R2 = 0,89 делаем вывод, что построенная модель объясняет дисперсию (колебания) результативного признака Y на 89 %, а 11 % приходится на долю факторов неучтенных в модели.
40
Средняя ошибка аппроксимации Eср.отн. ≈ 4 %, что меньше 7 %, следовательно, построенную модель можно использовать для
экономического анализа и прогноза. |
|
|
|
|
||||||||
|
|
|
При |
проверке |
значимости |
модели |
получены |
результаты |
||||
|
Fфакт. |
= 66,52 , |
Fтабл. (α = 0,05,v1 =1,v2 |
=8) =5,32. |
Так как |
Fфакт. > Fтабл. |
||||||
(66,52 > 5,32), то признается статистическая значимость модели. |
|
|||||||||||
|
|
|
При проверке значимости коэффициентов модели и коэффициента |
|||||||||
корреляции |
получены |
расчетные значения t -статистики: |
taˆ0 |
= 4,04 и |
||||||||
taˆ |
|
= tr |
xy |
= 8,16 . |
Табличное значение |
t -критерия: tтабл. = 2,3 . |
Так как |
|||||
1 |
|
|
|
|
|
|
|
|
|
|
||
|
taˆi |
|
> tтабл., |
i = 0,1, то коэффициенты aˆ0 , aˆ1 и коэффициент корреляции rxy |
||||||||
|
|
значимы.
Границы доверительных интервалов коэффициентов модели (с надежностью 95 %) следующие 0,6 ≤ a0 ≤ 2,19 и 0,83 ≤ a1 ≤1,48.
3.5 Экономический анализ и прогноз
Значения факторного признака для прогноза и соответствующее прогнозное значение результативного признака следующие: xpr = 2,61 и
yˆ pr = 4,41, соответственно. Предельная ошибка прогноза при уровне значимости α = 0,05 – ∆yˆ pr= 0,58. Откуда доверительный интервал прогноза результативного признака yˆ pr (с надежностью 95 %) имеет вид
3,83 < yˆ pr < 4,99.
3.6 Построение модели нелинейной парной регрессии
Анализируя графики и коэффициенты детерминации уравнений нелинейной регрессии (рис. 3.5 – 3.7) делаем вывод, что качество нелинейных моделей незначительно отличается от линейной модели (на 0,5 % – 1,5 %), поэтому для дальнейшего экономического анализа рекомендуется использовать линейную модель ввиду простоты экономической интерпретации ее параметров.
Пример построения и анализа парной модели регрессии по пунктам 1) – 9) задания лабораторной работы 3 рассмотрен полностью.
41

Y
6,0 |
|
|
5,5 |
y = 2,8088Ln(x) + 1,7774 |
|
R2 = 0,9029 |
||
|
||
5,0 |
|
4,5
4,0
3,5
3,0
1,2 |
1,7 |
2,2 |
2,7 |
3,2 |
3,7 |
|
|
|
X |
|
|
Рис. 3.5 – Корреляционное поле и кривая выборочной нелинейной регрессии
Y
6,0 |
|
|
|
5,5 |
y = -0,2828x2 |
+ 2,5693x - 0,2887 |
|
R2 = 0,9046 |
|||
|
|||
5,0 |
|
|
4,5
4,0
3,5
3,0
1,2 |
1,7 |
2,2 |
2,7 |
3,2 |
3,7 |
|
|
|
X |
|
|
Рис. 3.6 – Корреляционное поле и кривая выборочной параболической регрессии
42

Y
6,0 |
|
|
5,5 |
y = 2,3128x0,6776 |
|
R2 = 0,8978 |
||
|
||
5,0 |
|
4,5
4,0
3,5
3,0
1,2 |
1,7 |
2,2 |
2,7 |
3,2 |
3,7 |
|
|
|
X |
|
|
Рис. 3.7 – Корреляционное поле и кривая выборочной степенной регрессии
3.7 Вопросы для самопроверки по разделу 3
1.Регрессионные модели. Общие предпосылки регрессионного анализа. Теоретическое и эмпирическое уравнения регрессии.
2.Алгоритм построения и анализа регрессионных моделей.
3.Основные предпосылки метода наименьших квадратов (МНК).
4.Свойства оценок регрессионной модели.
5.Оценка параметров регрессионного уравнения с помощью МНК. Система нормальных уравнений.
6.Оценки параметров линейной модели парной регрессии. Расчетные формулы.
7.Матричная форма модели парной регрессии и формула расчета ее параметров.
8.Оценка качества уравнения регрессии. Объясненная и необъясненная составляющие уравнения регрессии.
9.Коэффициент детерминации и коэффициент корреляции, их расчет в модели парной регрессии.
10.Средняя относительная ошибка аппроксимации.
11.Проверка значимости уравнения регрессии в целом. F -критерий
Фишера.
12.Уровень значимости α и степени свободы при проверке значимости уравнения регрессии.
13.Мера точности регрессионного уравнения. Несмещенная оценка
дисперсии остаточной компоненты Se2 .
14.Оценка статистической значимости коэффициентов регрессии.
15.Доверительные интервалы параметров регрессии.
16.Прогнозирование с применением уравнения регрессии. Средняя стандартная ошибка прогноза.
43
Раздел 4. Модель множественной регрессии. Проверка предпосылок 1-МНК (отсутствия мультиколлинеарности между факторами-аргументами и гетероскедастичности возмущений).
Оценка параметров обобщенной линейной эконометрической модели
4.1 Модель множественной регрессии (задание 4.1) 4.1.1 Теоретические замечания
На большинство экономических показателей влияет не один, а несколько факторных признаков. Для адекватного описания таких зависимостей используются многофакторные эконометрические модели
(табл. 4.1).
Таблица 4.1
Примеры многофакторных эконометрических моделей
Результа- |
Факторные признаки |
Спецификация модели |
Данные для |
|||||||
тивный |
|
X1, X 2 ,...X m |
построения |
|||||||
признак Y |
|
|
|
|
|
|
|
модели |
||
1 |
|
|
2 |
|
|
3 |
|
|
|
4 |
Модели |
производственно-хозяйственной деятельности предприятий |
|||||||||
Прибыль |
X1 – инвестиции, |
|
|
|
|
|
|
|
||
Y |
X 2 |
– |
стоимость |
|
|
|
|
|
|
1) данные |
|
основных |
производ- |
|
|
3 |
|
|
|
по одному |
|
|
ственных фондов, |
Y = a0 + ∑ai Xi |
+ε |
предприяти |
||||||
|
X3 – фонд рабочего |
|
|
i =1 |
|
|
|
ю за n |
||
|
Y = a0 X1a1 X 2a2 X3a3 ε |
|||||||||
|
времени |
|
месяцев |
|||||||
|
|
|
|
|
|
|
|
|
|
(кварталов), |
Среднеме- |
X1 – производитель- |
|
|
|
|
|
|
|||
|
|
|
|
|
|
2) данные |
||||
сячная |
ность труда, |
|
|
|
|
|
|
по n |
||
зарплата |
X 2 – коэффициент |
|
|
|
|
|
|
|||
|
|
|
|
|
|
предприя- |
||||
Y |
текучести рабочей |
|
|
|
|
|
|
тиям |
||
|
|
|
3 |
|
|
|
||||
|
силы, |
|
Y = a |
|
|
|
+ε |
концерна |
||
|
|
|
+ ∑a X |
|
||||||
|
X3 |
– фондоемкость |
|
0 |
i =1 i |
|
i |
|
(отрасли) |
|
Объем |
X1 – основной |
|
|
|
|
|
|
данные по |
||
продукции |
капитал, |
|
|
|
|
|
|
|
одному |
|
Y |
X 2 – рабочая сила |
|
|
|
|
|
|
предприяти |
||
|
|
|
|
|
|
2 |
|
|
|
ю за n |
|
|
|
|
Y = a0 + ∑ai Xi |
+ε , |
месяцев |
||||
|
|
|
|
|
|
i =1 |
|
|
|
(кварталов, |
|
|
|
|
Y = a0 X1a1 X 2a2 ε |
|
|
|
|||
|
|
|
|
|
|
|
лет) |
44
Продолжение таблицы 4.1
1 |
|
|
|
2 |
|
|
|
|
3 |
|
|
|
4 |
Индекс |
|
X1 – индекс |
|
|
|
|
|
|
|
|
1) данные |
||
себесто- |
|
производительности |
|
|
|
|
|
|
|
|
по одному |
||
имости |
|
труда, |
|
|
|
|
|
|
|
|
предприя- |
||
продукции |
|
X 2 – индекс |
|
|
|
|
|
|
|
|
тию за n |
||
Y |
|
фондоотдачи, |
|
|
|
|
|
|
|
|
месяцев |
||
|
|
|
|
|
|
|
|
|
|
(кварталов), |
|||
|
|
X3 – доля |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
2) данные |
|||
|
|
заработной платы в |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
по n |
|||
|
|
общих затратах |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
предприя- |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y = a0 X1a1 X 2a2 X3a3 ε |
тиям |
||||||
|
|
|
|
|
|
концерна |
|||||||
|
|
|
|
Модели национальных экономик |
|
|
|
||||||
Нацио- |
|
X1 – фонд накопления, |
|
Y = a |
|
+ ∑a X |
|
+ε , |
|
||||
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
нальный |
|
X 2 – заработная плата |
|
|
0 |
i =1 |
i |
i |
|
|
|||
доход Y |
|
|
|
|
|
|
Y = a0 X1a1 X 2a2 ε |
|
|
||||
|
|
|
|
|
|
|
|
|
|||||
Объем |
Объем экспорта Et −1, за |
|
|
|
|
|
|
|
|
||||
экспорта |
период t −1, |
|
|
|
|
|
|
|
|
||||
Et , за |
V |
|
– объем |
|
|
|
|
|
|
|
|
||
период t |
|
t |
|
|
|
|
|
|
|
|
|
|
|
производства, |
|
|
|
|
|
|
|
|
|||||
|
|
It |
– соотношение цен на |
|
Et = a0 + a1Et −1 + |
|
|||||||
|
внешнем и внутреннем |
|
|
||||||||||
|
рынках |
|
+a2Vt +a3It +ε |
|
|
|
|||||||
Валовой |
|
X1 – численность |
|
|
|
|
|
|
|
|
|||
внутрен- |
рабочих и служащих, |
|
|
|
|
|
|
|
|
||||
ний |
занятых в сфере |
|
|
|
|
|
|
|
|
||||
продукт |
материального |
|
|
|
|
|
|
|
|
||||
Y |
производства, |
|
|
|
2 |
|
|
|
|
||||
|
|
X 2 – среднегодовой |
|
Y = a |
|
|
|
+ε |
|
||||
|
|
|
|
+ ∑a X |
|
|
|||||||
|
объем основных произ- |
|
|
0 |
i =1 |
i |
i |
|
|
||||
|
водственных фондов |
|
|
|
|
|
|
|
|
||||
Темпы |
|
X1 – реальный |
|
|
|
|
|
|
|
|
|||
экономи- |
среднедушевой ВВП, |
|
|
|
|
|
|
|
|
||||
ческого |
|
X 2 – бюджетный |
|
|
|
|
|
|
|
|
|||
роста |
дефицит, |
|
|
|
|
|
|
|
данные по |
||||
|
|
X3 – объем инвестиций, |
|
|
|
|
|
|
|
стране за n |
|||
|
|
X 4 – внешний долг, |
|
|
|
4 |
|
|
|
месяцев |
|||
|
|
X |
|
– уровень инфляции |
|
Y = a |
|
+ ∑a X |
|
+ε |
(кварталов, |
||
|
|
|
5 |
|
|
|
|
0 |
i =1 |
i |
i |
|
лет) |
45

Социально-экономические модели
Расходы |
X1 – общие расходы, |
Y = a |
|
2 |
|
|
+ε |
данные по |
|||||
|
+ ∑a X |
|
|||||||||||
на |
X 2 |
– |
размер |
средней |
|
0 |
i =1 |
i |
i |
|
n семьям, |
||
питание |
семьи |
|
|
|
|
|
|
|
|
|
|
средние |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
показатели |
|
|
|
|
|
|
|
|
|
|
|
|
|
по n |
|
|
|
|
|
|
|
|
|
|
|
|
|
регионам |
|
|
|
|
|
|
|
|
|
|
|
|
|
страны |
Уровень |
X1 – уровень реальной |
Y = a |
|
2 |
|
|
+ε |
|
|||||
|
+ ∑a X |
|
|
||||||||||
преступн |
заработной платы, |
|
|
0 |
i =1 |
i |
i |
|
|
||||
ости |
X 2 |
|
– |
|
уровень |
|
|
|
|
|
|
|
|
|
безработицы |
|
|
|
|
|
|
|
|
|
|
||
Уровень |
X1 |
– |
темп |
роста |
|
|
|
|
|
|
|
||
оплаты |
(уменьшения) |
реальной |
|
|
|
|
|
|
|
||||
жилищно |
заработной |
платы, |
в |
|
|
|
|
|
|
|
|||
-комму- |
процентах к соответству- |
|
|
|
|
|
|
|
|||||
нальных |
ющему |
периоду |
пре- |
|
|
|
|
|
|
|
|||
услуг |
дыдущего |
года, |
в |
|
|
|
|
|
|
|
|||
|
процентах; X 2 – уровень |
|
|
|
|
|
|
|
|||||
|
безработицы |
населения |
|
|
|
|
|
|
|
||||
|
(по методологии МОП) в |
|
|
|
|
|
|
|
|||||
|
возрасте 15–70 лет, в |
|
|
|
|
|
|
|
|||||
|
процентах; X3 – средне- |
|
|
|
|
|
|
|
|||||
|
месячная |
заработная |
|
|
|
|
|
|
|
||||
|
плата, |
грн; |
|
X 4 |
– |
|
|
5 |
|
|
|
данные по |
|
|
индексы |
потребитель- |
Y = a0 + ∑ai Xi + ε |
n регионам |
|||||||||
|
ских цен |
|
|
|
|
|
i=1 |
|
|
|
страны |
||
|
Модели маркетинга (спроса и предложения) |
|
|||||||||||
Объем |
X1 – цена предприятия, |
|
|
|
|
|
|
данные по |
|||||
продаж |
X 2 – цена конкурентов, |
|
|
|
|
|
|
одному |
|||||
предприя |
X3 |
– расходы на |
|
|
|
|
|
|
|
|
предприя- |
||
тия |
рекламу |
|
|
|
|
|
|
3 |
|
|
|
тию за n |
|
|
|
|
|
|
Y = a |
|
|
|
+ε |
месяцев |
|||
|
|
|
|
|
|
|
|
+ ∑a X |
|
||||
|
|
|
|
|
|
|
|
0 |
i =1 |
i |
i |
|
(кварталов) |
Цена |
X1 – число комнат, |
|
|
|
|
|
|
|
|
||||
квартиры |
X 2 – район, |
|
|
|
|
|
|
|
|
|
|
||
|
X3 – общая площадь |
|
|
|
|
|
|
|
|||||
|
квартиры, |
|
|
|
|
|
|
|
|
|
|
||
|
X 4 – жилая площадь, |
|
|
7 |
|
|
|
данные по |
|||||
|
X5 |
– тип дома, |
|
|
Y = a |
|
|
|
+ε |
городу по n |
|||
|
|
|
|
+ ∑a X |
|
||||||||
|
X6 – наличие балкона |
|
0 |
i =1 |
i |
i |
|
квартирам |
46
Формулы для расчета оценок параметров многофакторных эконометрических моделей ( m >1, m – количество факторных признаков), а также показателей качества модели, прогноза, проверки статистических гипотез относительно параметров модели аналогичны формулам для однофакторных эконометрических моделей ( m =1), [3].
Воспользуемся матричной формой записи многофакторной модели
где
y1 |
|
|
|
y |
2 |
|
|
|
|
|
|
... |
|
, X |
|
Y = y |
|
||
|
i |
|
|
... |
|
|
|
|
|
|
|
yn |
n×1 |
|
|
1 |
x11 |
x12 |
|
1 |
x |
x |
|
|
21 |
22 |
|
|
|
... |
= ... ... |
|||
|
1 |
x |
x |
|
i1 |
i2 |
|
... ... |
... |
||
|
1 |
x |
x |
|
|
n1 |
n2 |
Y= XA +
... x1m
... x2m
... ...
... xim
... ...
... xnm
ε ,
n×(m+1)
a0a1 , = a2
A ...
ai...
am (m+1)×1
(4.1)
ε1ε2...
, ε = εi .
...
εn n×1
Y – матрица-вектор |
зависимой переменной; X |
– матрица |
наблюдений независимых |
переменных размерностью |
n ×(m +1) |
(единичный столбец добавляется в эту матрицу для получения коэффициента a0 в регрессионном уравнении). A – матрица-столбец
размерностью (m +1)×1. ε – вектор-матрица случайных отклонений (возмущений) размерностью n ×1. Величины a0 , a1,..., am оцениваются на
основе выборочных наблюдений, поэтому расчетные показатели не являются истинными, а представляют собой их статистические оценки.
Теоретическая модель (4.1) представляется как эмпирическая в матричной записи
ˆ |
ˆ |
+e . |
(4.2) |
Y = XA +e =Y |
Оценка параметров модели множественной регрессии производится с помощью МНК по формуле
ˆ |
= (X ′ X ) |
−1 |
X |
|
|
||||
A |
|
|||
При этом |
|
|
|
|
n |
2 |
′ |
|
ˆ′ |
|
|
|||
∑ei |
=Y Y − A X |
i=1
′ Y . |
(4.3) |
′Y . (4.4)
47

При построении модели множественной регрессии отбор наиболее существенных факторов, воздействующих на результативный признак, проводится на основе теоретического анализа в сочетании с использованием статистических приемов.
Сначала на основе содержательного анализа составляется перечень показателей X1,..., Xm . Затем производится сбор статистической
информации и предварительный анализ данных, после чего осуществляется сравнительная оценка и отсев части факторов.
Для отбора показателей в регрессионную модель составляется матрица парных коэффициентов корреляции r , измеряющая тесноту связи каждого из факторов с результативным признаком и между собой.
Корреляционная матрица r имеет вид
1
rx y
r= rx2 y
K
rxm y1
ryx |
ryx |
2 |
|
|
1 |
|
|
1 |
|
rx x |
|
|
|
1 |
2 |
rx x |
1 |
|
|
2 |
1 |
|
|
KK
rx |
x |
rx |
x |
m |
1 |
m |
2 |
K ryx |
|
|
|
|
m |
|
|
K rx x |
|
|
|
K |
r 1 m |
. |
(4.5) |
|
x2 xm |
|
|
K |
K |
|
|
|
|
|
|
K |
1 |
|
|
|
(m+1)×(m+1) |
|
|
Путем анализа корреляционной матрицы производится отбор факторов для построения модели. Существуют две метода отбора факторов для модели: метод включения – дополнительное введение фактора и метод исключения– исключенияфакторовизполногоегонабора.
Первый метод: признак X j включается в уравнение в том случае,
если его включение существенно увеличивает значение множественного коэффициента корреляции, рассчитываемого по формуле
|
|
|
|
Ry xj = |
1 |
− |
|
|
r |
|
|
, |
j = |
|
, |
(4.6) |
|
|
|
|
1,m |
||||||||||||
|
|
|||||||||||||||
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
R jj |
|
|
|
|
|||||
где |
|
r |
|
– определитель |
|
корреляционной матрицы, а |
R jj – |
|||||||||
|
|
|
||||||||||||||
алгебраическое дополнение элемента rjj |
той же матрицы r . |
|
Примечание. Как показывает практика можно считать, что существенным увеличением является увеличение множественного линейного коэффициента корреляции не менее, чем на 10 %.
Так как значение множественного коэффициента корреляции зависит от количества включаемых в модель аргументов X j , то при расчетах
необходимо использовать скорректированный множественный коэффициент корреляции
48