Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Главы 4-5-2013.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
474.11 Кб
Скачать

Тест Грегори Чоу

В том случае, когда фиктивная переменная действует на коэффициент при объясняющей переменной, линия модели отличается от той, которая была до уровня х0 (рис. 4.3б), что соответствует разбиению выборочных данных на две части (группы) и рассмотрению отдельных уравнений регрессии по каждой выборке (подвыборке).

В практических исследованиях достаточно часто возникает вопрос, имеет ли смысл разбивать выборку на части и строить так называемою кусочно-линейную модель с фиктивными переменными (рис. 4.3б) или ограничиться «обыкновенной» общей регрессией для всего диапазона точек наблюдений?

Для ответа на этот вопрос обычно используется тест (критерий) Грегори Чоу [1,28], суть которого заключается в следующем. Пусть общая выборка имеет объем n Через S0 обозначим сумму квадратов отклонений выборочных данных от их модельных оценок, полученных по общему уравнению регрессии. Разобьем выборку на две подвыборки объемами n1 и n2 соответственно (n1 + n2 = n). Будем считать, что для каждой подвыборки можно построить уравнения регрессии одного вида, но с разными коэффициентами b. Через и обозначим соответствующие суммы квадратов отклонений. Далее рассмотрим некоторые соотношения.

Очевидно, что равенство S0 = S1 + S2 выполняется лишь при совпадении коэффициентов регрессии для всех трех уравнений. Тогда отклонение S0  (S1 + S2) может быть использовано как показатель улучшения качества модели при разбиении интервала наблюдений на две подвыброки, так как чем сильнее различие в поведении Y для каждой из подвыборок, тем больше значение S0 будет превосходить сумму S1 + S2. Следовательно, отношение [S0  (S1 + S2)]/(m + 1) будет определять оценку уменьшения дисперсии регрессии за счет построения двух уравнений вместо одного.

При разбиении общей выборки число степеней свободы сократится на (m + 1), т. к. теперь вместо (m + 1) параметра объединенной регрессионной модели необходимо оценивать (2m + 2) коэффициента двух регрессий. В данном случае соотношение (S1 + S2)/(n  2m  2) выражает необъясненную дисперсию зависимой переменной при рассмотрении двух регрессий.

Приведенные выше рассуждения позволяют сделать вывод о том, что общую выборку целесообразно разбивать на два интервала только в том случае, если соответствующее уменьшение дисперсии будет значимо больше оставшейся необъясненной дисперсии. Этот вывод может быть основан на стандартной процедуре сравнения дисперсий на основе F-статис­тики, наблюдаемое значение которой для данного анализа имеет вид:

(4.23)

где m  число количественных объясняющих переменных в уравнениях регрессии (m  одинаково для всех трех уравнений модели).

Если Fнабл < Fкр при заданном уровне значимости  и соответствующих числах степеней свободы v1 = m + 1 и v2 = n  2m  2, то можно считать, что различие между S0 и S1 + S2 статистически незначимо и нет смысла разбивать уравнение модели на части путем введения фиктивных переменных. Следует заметить, что фактически мы тестируем гипотезу Н0 о равенстве коэффициентов b уравнений регрессии, построенных по каждой подвыборке. Если нулевая гипотеза Н0 верна, то две регрессионные модели можно объединить в одну, построенную по выборке объема n = n1 + n2.