Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tipovoy_raschet_31.docx
Скачиваний:
7
Добавлен:
24.05.2015
Размер:
519.27 Кб
Скачать

2.3.2. Анализ качества

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

6

200,2598778

33,37664631

2,511891208

0,060557777

Остаток

18

239,1742252

13,28745696

Итого

24

439,434103

Fтаб. = 2,66; Fфак.< Fтаб. - гипотеза о случайности различий фактической и остаточной дисперсий принимается. Модель не значима, не адекватна.

Fфак.< 4Fтаб. – модель непригодна для прогноза.

Множественный R

0,675071999

R-квадрат

0,455722204

R=0,7 – средняя связь между изучаемыми явлениями.

t-статистика

У

1,813873204

X1

-0,104845136

Х2

-0,285027864

Х3

-1,522481769

Х4

1,075174914

Х5

-0,810179874

Х6

0,315094833

ttab =2,1009: t0-t6 < ttab, поэтому гипотеза о статистической незначимости уравнения регрессии не отклоняется, b0 и b1 – статистически незначимы, признается случайная природа формирования коэффициентов регрессии.

S­2 = MSe =13,28745696

2.3.3 Диагностика

Fтаб. = 2,66; Fфак.< Fтаб. - гипотеза не отклоняется и признается случайная природа формирования показателей модели. Модель признана не адекватной, существуют пути её улучшения, которые основаны на устранении избыточных регрессоров или введением значимых факторов. Для выяснения, каким же путем может быть улучшена построенная модель, проверим, нарушается ли предположение <2.1>. Данное предположение имеет следующую формулировку: адекватная наблюдениям модель линейна по элементам вектора . Чтобы проверить, нарушается ли данное предположение, определим значенияt-статистики Стьюдента.

Значения t-статистики были рассчитаны в работе Пакета анализа (опция Регрессия) Для заданного объема выборки по t-таблице распределения Стьюдента при двустороннем 95% -ом доверительном интервале определяем критическое значение t-статистики (), которое показывает на сколько стандартных ошибок отличается выборочный коэффициент регрессии, чтобы нулевая гипотеза оставалась истинной. В нашем случае= 2,1009.ttab =2,1009: < ttab. Так как, в соответствии с t-критерием Стьюдента все t-критерии признаются незначимыми, то мы произведем выброс факторов в зависимости от их величины. С целью устранения возникших нарушений и улучшения модели, предлагается устранить избыточные (незначимые) переменные и пересчитать заново β-коэффициенты.

t-статистика

Величина t-статистики

tb0

1,813873204

tb1

-0,104845136

tb2

-0,285027864

tb3

-1,522481769

tb4

1,075174914

tb5

-0,810179874

tb6

0,315094833

Поскольку t1,t2,t3,t5 обладают наименьшими значениями из всех имеющихся t-критериев, то именно их мы уберем из модели.

Предположение РА-МНК <3.1> подразумевает, что регрессоры х01,..,хp-1 являются линейно-независимыми векторами матрицы Х. Проверим, выполняется ли это предположения в нашем случае.

Следствием нарушения данного предположения является наличие мультиколлинеарности в построенной модели. Чтобы определить, существует ли в нашем случае мультиколлинеарность, построим матрицу парных коэффициентов корреляции.

Y

X1

X2

X3

X4

X5

X6

У

1

X1

0,198175886

1

X2

-0,560521003

-0,459030475

1

X3

-0,616932105

-0,234669005

0,803022332

1

X4

0,436713528

0,396307843

-0,456252668

-0,378298928

1

X5

-0,301048731

0,109096368

0,249256884

0,21276836

-0,179652888

1

X6

-0,409801831

-0,138184222

0,634944278

0,581881137

-0,49075772

0,266984593

1

Произведем отбор наиболее значимых регрессоров х. Для этого определим, выполняется условие о наличии связи между факторами не более 0,8-0,9. Не выполнение этого условия говорит о существовании мультиколлинеарности в модели. Парный коэффициент корреляции rx2x3 равен 0,8, что свидетельствует о мультиколлинеарности факторов х2 и х3. Данные факторы находятся в линейной связи и являются дублирующими переменными. Чтобы исключить дублирование воздействия на результативный признак предлагается устранить из модели множественной регрессии один из дублирующих факторов. В данном случае, из модели уберем фактор х3.

Предположение РА-МНК <4.2> подразумевает, что ε распределены по нормальному закону. Следствием нарушения данного предположения является наличие выбросов на графике остатков. Для того чтобы определить нарушается ли данное предположение в нашем случае, построим график остатков.

За пределами полосы ±2 в данном примере находится 2 точки, соответствующие наблюдениям под номером 18 и 23. При расчете остатков также были рассчитаны стандартизированные остатки, это так называемы нормированные остатки, которые не зависят от исходной величины измерения. Поэтому стандартизированные остатки с величиной более 2 или менее -2 являются потенциальными выбросами и подлежат выбросу из модели. В нашем случае стандартизированные остатки, не входящие в ранее указанный интервал, принадлежат наблюдениям под номерами 18 и 23. Данное обстоятельство также свидетельствует о нарушении предположения <4.2> Таким образом, данные наблюдения подлежат устранению из РА.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]