Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ekzamen.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
235.56 Кб
Скачать

20. Проверка качества уравнения регрессии. F-критерий Фишера.

Для оценки качества полученного множественной уравнения регрессии используют коэффициент детерминации, представляющий собой отношение объясненной части D(ŷ) дисперсии переменной у ко всей дисперсии D(y):

R2= , (3.18) R2= , (3.19) гдеD(у)= ∑ (уі-ӯ)2,(3.20) D(ŷ)= ∑ (ŷі-ӯ)2,(3.21)

D(е)=Dост= ∑ (уіі)2.(3.22)

Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0≤ R2≤ 1 и показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Чем выше значение R2, тем лучше данная модель согласуется с данными наблюдений.

Оценка статистической значимости уравнения регрессии, а также коэффициента детерминации R2 осуществляется с помощью F-критерия Фишера:

F= = .(3.23)

где p - число независимых переменных в уравнении регрессии.

Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условия Fр>Fт, где Fт определяется по таблицам F-критерия Фишера по двум степеням свободы k1=p, k2=n-p-1 и заданному уровню значимости α.

Для оценки тесноты связи факторов с исследуемым признаком, задаваемой построенным уравнением регрессии, используется коэффициент множественной корреляции R:

R= = = .(3.24)

Коэффициент множественной корреляции R принимает значения вдиапазоне 0R1.

Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость согласуется с данными наблюдений. При R=1(R2=1) связь становится функциональной, т. е. соотношение ŷ=f(x1,x2,...,xp)точно выполняется для всех наблюдений.

Коэффициент множественной корреляции также используется как характеристика качества построенного уравнения регрессии, точности построенной модели.

В случае линейной зависимости коэффициент корреляции R связан с парными коэффициентами корреляции соотношением:

R= ,(3.25)

где βі - стандартизованные коэффициенты регрессии.

Недостаток использования коэффициента множественной детерминации R2 для оценки качества модели в том, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2.

Поэтому при большом количестве факторов необходимо использовать скорректированный, улучшенный коэффициент множественной детерминации , определяемый соотношением:

=1- =1- ,(3.26)

где m- число факторов в уравнении регрессии,

n-число наблюдений.

Чем больше величина p, тем сильнее различия и R2.

При использовании улучшенного коэффициента для оценки целесообразности включения фактора в уравнение регрессии следует учитывать, что увеличение этого коэффициента при включении нового

Продолжение вопроса 21.

фактора не обязательно свидетельствует о его значимости, поскольку значение увеличивается всегда, когда t-статистика больше единицы (/t/>1).

При заданном объеме наблюдений и других равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает.

При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации обусловлено следующими причинами:

- в регрессионную модель не включены существенные факторы;

- неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.

ЧастныйF-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом.

Если оценивается значимость влияния х1, как дополнительно включенного в модель фактора, то используется следующая формула:

= * ,(3.27)

где – коэффициент множественной детерминации для модели с полным

набором факторов;

– тот же показатель, но без включения в модель фактора х1;

n – число наблюдений;

m – число параметров в модели (без свободного члена).

Если оцениваем значимость влияния фактора хр после включения в модель факторов х1, х2, …, хр-1, то формула частного F-критерия примет вид:

= * .(3.28)

В общем виде для фактора хiчастныйF-критерий определяется как:

= * .(3.29)

В числителе формул 3.27-3.29 показан прирост доли объясненной вариации уза счет дополнительного включения в модель соответствующего фактора:

- – прирост за счет х1;

- – прирост за счет хр;

– прирост за счет хi.

Фактическое значение частного F-критерия сравнивается с табличным при 5 %-ном или 1 %-ном уровне значимости и числе степеней свободы: 1 и n-m-1. Если фактическое значение превышает табличное, то дополнительное включение фактора хiв модель статистически оправдано и коэффициент чистой регрессии biпри факторе хi статистически значим. Если же фактическое значение меньше табличного, то дополнительное включение в модель фактора хi не увеличивает существенно долю объясненной вариации признака у, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически не значим.

С помощью частного F-критерия проверяют значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор хiвводится в уравнение множественной регрессии последним.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]