эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024
.pdf
ˆ |
1 2 ln F* 1 2(1 1 1 2 ) |
, |
|
|
|
|
|
|
F |
1 2 1 1 1 2 |
|
|
|
|
|
||
|
|
|
|
|
|
|||
где F * s12 s22 . |
|
|
|
|
|
|
|
|
Статистика F в условиях справедливости |
|
гипотезы H 0 |
подчинена |
|||||
нормальному распределению |
N(0,1), |
табличное |
(критическое) |
значение |
||||
критерия |
обозначим |
кр |
|
ˆ |
кр |
, |
то принимается нулевая |
|
F ( 2 ; 1 ) . Если |
F F |
|
||||||
гипотеза, т.е. гипотеза об однородности ряда.
Проверка однородности дисперсий выборок на основе G-статистики критерия Кокрена
Критерий Кокрена применяется при одинаковых объемах k независимых случайных выборок, то есть: n1=…=nk=n, значения дисперсий выборок предполагаются неизвестными. Проверяемые гипотезы формулируются так:
Н0 : 12 ... к2 2 ;
Н1 : 12 ... к2 2 .
Расчетная статистика критерия Кокрена29 для проверки гипотезы H 0 при заданном уровне значимости имеет вид
ˆ |
|
|
smax2 |
|
|
|
|
|
|
|
|
G |
|
|
|
, |
|
|
|
|
|||
s 2 ... s 2 |
|
|
|
|
|||||||
|
1 |
|
k |
|
|
|
|
|
|
|
|
где smax2 |
max{si2 }. |
|
|
|
|
|
|
|
|||
|
|
i |
|
|
|
|
|
|
|
|
|
Далее на основе F-статистики Фишера определяется значение |
|||||||||||
G1 (k, ) |
|
F1 / k ( |
, (k 1) ) |
, |
|||||||
k 1 |
F |
|
( |
, (k 1) ) |
|||||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
1 / k |
|
|
|
|
где n 1 , |
F1 / k ( 1, 2 ) |
|
- |
квантиль уровня 1 / k F-распределения, с |
|||||||
1 ; 2 (k 1) .
29 G-статистика критерия Кокрена связана с двусторонним F-критерием Фишера. Так для k=2 выполняется соотношение G F /( F 1) [8, с.96].
Если вычисленное выборочное значение статистики Кокрена
ˆ , то гипотеза о равенстве дисперсий отвергается.
G G1 (k, )
Проверка гипотезы о равенстве средних значений двух генеральных совокупностей на основе t-критерия Стьюдента
Пусть имеются две выборки: x1i ,i 1, n1 и x2i ,i 1, n2 . Предполагается, что они получены из одной и той же нормальной генеральной совокупности. Проверим гипотезу о равенстве средних по выборкам (иногда она формулируется, как равенство нулю разницы между средними). Для ее тестирования можно использовать t-критерий Стьюдента. Однако математические выражения для его вычисления будут различны при различных гипотезах относительно данных о выборочных дисперсиях [1, 8, 10, 12]. Сформулируем возможные варианты проверки гипотез.
Вариант 1. H 0 |
: 1 0, |
H1 : 1 0 , где 0 - константа. |
||||
Расчетное значение t-статистики определяется по формуле: |
||||||
tˆ |
|
|
0 |
|
|
|
x1 |
|
n1 , |
|
|||
|
|
s1 |
|
|
||
|
|
|
|
|
|
|
где число степеней свободы определяется из условия n1 1.
Вариант 2. H0 : 1 2, 12 22 и H1 : 1 2
Вычисляем t-статистику по формуле:
tˆ |
|
x |
|
x |
|
|
|
|
|
1 |
|
|
|
, |
|
|
2 |
1 |
|
|
|
|
|
||||||||
|
|
s |
|
1 / n1 1 / n2 |
|
|
|||||||||
где s |
(n 1)s2 |
(n |
2 |
1)s2 |
, |
|
|||||||||
1 |
1 |
|
|
|
2 |
|
|
||||||||
|
|
|
n1 n2 2 |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|||||||
а число степеней свободы n1 |
n2 2 . |
||||||||||||||
Вариант 3. |
H0 : 1 2, |
12 |
22 |
и H1 : 1 2 |
|||||||||||
Вычисляем t-статистику:
tˆ |
|
|
x2 |
|
x1 |
|
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 |
/ n |
s2 |
/ n |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
1 |
1 |
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
(s12 / n1 s22 / n2 )2 |
|
|
|
|
|
||||
где число степеней свободы |
|
|
|
|
|
|
|
|
|
|
|
, |
|||||||||
(s2 |
/ n )2 |
/(n |
1) (s2 |
/ n |
2 |
)2 |
/(n |
2 |
1) |
||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
1 |
1 |
2 |
|
|
|
|
|
|
||
а [x] – целая часть числа х, значение округляется по обычным правилам. Вариант 4. Нет никакого предположения о 2 , при этом n1 n2 , тогда
H0 : 1 2, ; H1 : 1 2 .
|
|
t-статистика определяется из формулы: tˆ y n2 |
/ sy , |
||||||||||||
где |
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
y |
x2 |
x1 |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
2 (x2i x1i |
|
|
)2 |
|
|
|
|||
|
|
|
|
|
y |
, |
|
|
|||||||
|
|
sy |
|
i 1 |
|
|
|
|
|||||||
|
|
|
|
|
n2 |
1 |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
а число степеней свободы n2 1. |
|
|
|||||||||||||
|
|
В условиях |
справедливости гипотезы |
H 0 |
статистика критерия tˆ |
||||||||||
подчинена |
|
t-распределению Стьюдента с |
степенями свободы. Если |
||||||||||||
tˆ t /2 ( ) , то гипотеза о равенстве средних двух нормальных генеральных совокупностей отвергается, в противном случае она принимается.
Критерий серий, основанный на медиане выборки
Критерии серий тем или иным способом «улавливают» смещение в уровнях выборочных наблюдений генеральной совокупности и оценивают регулярность этого смещения.
При оценивании случайности выборки хi , i 1,n на основе критерия серий по медиане выборки, в качестве «эталонного» уровня отсчета изменений берут значение выборочной медианы - xˆmedn .
Напомним, что для вариационного ряда (считаем, что выборка преобразована, и ее элементы уже расположены, например, в порядке возрастания) значение медианы определено как
|
1 |
(x |
x |
|
), если n четно |
|
(n) 2 |
( n ) |
( n |
1) |
|
|
|
xmed |
|
2 |
2 |
|
|
. |
|
|
, если |
n нечетно |
|||
x |
|
|
||||
|
( n 1) |
|
|
|
|
|
|
|
2 |
|
|
|
|
Далее на основе членов исходной выборки формируют ряды (серии) знаковой определенности по следующему правилу: на i-м месте выборки ставят плюс, если xi xˆmedn , и минус, если xi xˆmedn (члены выборки, равные xˆmedn исключают из рассмотрения). Полученную знаковую последовательность можно представить, как последовательность серий (серия - группа элементов одного знак) Она характеризуется общим числом серий - (n) и объемом самой большой серии - (n) . В случае стохастически независимых наблюдений чередование плюсов и минусов должно быть более или менее «случайным», причем последовательность не должна содержать слишком длинных серий.
Критерий |
рассматривает одновременно |
пару критических статистик |
(n); (n) , |
причем распределение (n) |
в предположении справедливости |
гипотезы о стохастической независимости результатов наблюдения
оказывается |
приблизительно нормальным со средним M (n) |
n 2 |
и |
||||
2 |
|||||||
|
|
|
|
|
|
||
дисперсией D (n) 1 |
(n 1) |
. Значение (n) изучено и затабулировано. |
|
|
|||
|
|
4 |
|
|
|
|
|
Например, при |
заданном уровне значимости 0,05 , проверяются |
||||||
следующие неравенства: |
|
|
|
||||
max (n) [3,3 (lg n 1)] , |
|
|
|||||
|
1 |
(n 1 1,96 |
|
|
|
||
(n) |
2 |
n 1) . |
|
|
|||
|
|
|
|
|
|
||
Если хотя бы одно из неравенств нарушается, то гипотеза о стохастической независимости в исходных наблюдениях отвергается.
Критерий «восходящих» и «нисходящих» серий
Этот критерий также оперирует со знакопостоянными сериями, образованными из условия: на i-м месте ставится плюс, если xi 1 xi 0 , и
минус, если xi 1 xi 0 (если два или несколько следующих друг за другом наблюдений равны между собой, то принимается во внимание только одно из них).
В ранее принятых обозначениях, при уровне значимости, 0,05 разрешающее правило теста определяется так:
(n) |
|
1 |
(2n 1) |
1,96 |
16n |
29 |
|
, |
|
3 |
90 |
|
|
||||
|
|
|
|
|
|
|
(n) 0 (n) ,
где величина 0 (n) табулируется и определяется на основе следующих правил:
если n 26 , то 0 (n) =5;
если 26<n<=153, то 0 (n) =6;
если 153<n<=1170, то 0 (n) =7.
В случае нарушения хотя бы одного из неравенств гипотезу о случайности выборки следует отвергнуть.
Тест Фостера-Стюарта
Рассматривается ряд xt ,t 0,T и производные от него ряды ut и lt . Последние строят, исходя из следующих соображений.
Пусть u0 0 , l0 0 , тогда для любого наблюдения t можно поставить в соответствие следующие значения переменных:
ut
lt
1, xt xt , 1 t ;0, xt xt , 1 t
1, x |
t |
x |
t |
, 1 t |
. |
|
|
|
|||
0, xt xt , 1 t |
|
||||
На их основе вычисляются вспомогательные суммы вида:
T |
|
s st , где st |
ut lt ; |
t 1 |
|
T |
|
d dt , где dt |
ut lt . |
t 1 |
|
Доказано, что величины s и d асимптотически нормальны и имеют независимое распределение.
Очевидно, что с помощью распределения величины d можно проверить гипотезу о наличии тенденции в средних, а с помощью s - о тенденции в дисперсиях. Сформулируем соответствующие конкурирующие гипотезы.
1.H01 : d 0 ; H11 : d 0 .
Вычислим T1 |
|
d 0 |
, |
|
|
|
|
||||
|
|
|
d |
|
|
|
|
|
|
||
где d - стандартная ошибка d и сравним с критическим значением. |
|||||
Если T1 tкр при заданном |
уровне значимости и числе степеней |
||||
свободы T 1, |
то гипотеза H 01 |
отклоняется, следовательно, тенденция в |
|||
средних имеется. |
|
|
|
|
|
2.H 02 : s ; H12 : s .
Вычислим T2 |
s |
, |
|
|
|
||
|
|
|
|
|
s |
|
|
где s - стандартная ошибка |
s , а его математическое ожидание и сравним с |
||
критическим значением. |
|
||
Если T2 tкр , то при заданном уровне значимости и числе степеней |
|||
свободы T 1 гипотеза |
H02 принимается, следовательно, тенденция в |
||
дисперсиях отсутствует. |
|
||
Значения d , s , и табулированы (таблица 4.4) для различных величин объемов выборок (T).
Таблица 4.430- Значения средней и стандартных ошибок d , s |
для объемов |
||||
выборок (T) от 10-50 |
|
|
|
|
|
|
|
|
|
|
|
T |
|
|
s |
|
d |
|
|
|
1,288 |
|
|
10 |
|
3,858 |
|
1,964 |
|
15 |
|
4,636 |
1,521 |
|
2,153 |
20 |
|
5,195 |
1,677 |
|
2,279 |
25 |
|
5,632 |
1,791 |
|
2,373 |
30 |
|
5,990 |
1,882 |
|
2,447 |
35 |
|
6,294 |
1,956 |
|
2,509 |
40 |
|
6,557 |
2,019 |
|
2,561 |
45 |
|
6,790 |
2,072 |
|
2,606 |
50 |
|
6,998 |
2,121 |
|
2,645 |
Тестирование ряда случайной величины на нормальность распределения
Тесты на нормальность распределения предполагают проверку асимметрии (третий момент) и эксцесса (четвёртый момент). Если распределение нормально, то M( i3) 0 и M( i4 3 4 ) 0.
Если |
M( i3) 0, то распределение случайной |
i не будет симметричным |
относительно нуля. |
|
|
Если |
M( i4 3 4 ) 0, то распределение |
случайной i показывает |
избыточный эксцесс, т.е. распределение остатка имеет более «тяжёлые» хвосты, чем нормальное распределение.
Для оценки соответствия распределения случайной величины x нормальному закону проверяются характеристики формы ее распределения, а именно - показатели асимметрии (А) и эксцесса (Э). Их выборочные значения рассчитывают по формулам
|
|
1 |
(x i x )3 |
|
|
||
A |
|
n |
|
|
|
|
|
|
1 |
(x i x ) |
2 |
3 , |
|||
|
|||||||
|
|
|
|
|
|||
|
|
n |
|
|
|||
|
|
|
|
|
|||
|
|
1 |
(x i x)4 |
|
|
|
|
Э |
|
n |
|
|
|
|
3 |
|
1 |
(x i x ) |
|
|
4 |
||
|
2 |
|
|
||||
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
Далее для каждого значения проверяются разрешающие условия вида:
30 Приводится |
по работе: Статистическое моделирование и прогнозирование / Под ред. |
А.Г. Гранберга. |
– М.: Финансы и статистика, 1990, с.373. |
|
|
A |
|
1,5 |
A |
|||
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
Э |
|
|
6 |
|
|
1,5 Э , , |
|
|
|
|
|
||||
|
|
n 1 |
||||||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|||
где A и Э - среднеквадратические ошибки коэффициентов асимметрии и эксцесса соответственно. Они в свою очередь оцениваются по формулам:
|
|
|
6 (n 2) |
; |
Э |
24 n (n 2) (n 3) |
|
||||
A |
|
|
(n 1) |
2 (n 3) |
(n 5) . |
||||||
(n 1) |
(n 3) |
||||||||||
|
|
|
|||||||||
Если одновременно выполняются оба разрешающие неравенства, то гипотеза о нормальном характере распределения случайной составляющей ряда не отвергается. Если же выполняется хотя бы одно из условий
|
|
A |
|
|
2 A |
|
|||
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
Э |
|
|
6 |
|
|
|
2 Э , , |
|
|
|
|
|
|
||||
|
|
n 1 |
|
|
|||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
||||
то гипотеза о нормальном характере распределения случайной составляющей отвергается. В других ситуациях требуется проводить более тщательный анализ.
Тест Джарка-Бера (JB) на нормальность
JB-тест является асимптотическим и применим на больших объёмах статистики. Проверяемые гипотезы формулируются следующим образом:
H0 : M( i3) 0 и M( i4 3 4 ) 0. H1 : M( i3) 0 и M( i4 3 4 ) 0/
С учётом ранее введённых обозначений расчётное значение статистики Джарка-Бера (Jarque, Bera, 1980) вычисляется так:
|
|
|
1 |
n |
3 |
2 |
|
1 |
|
|
1 |
n |
4 |
2 |
|
|
|
|
1 |
|
ei |
|
|
|
|
ei |
|
|
|
|
|||||
JB n |
|
|
|
3 |
|
|
|
|
|
|
|
4 |
|
|
|
||
6 |
|
24 |
|
3 . |
|
|
|||||||||||
|
|
n i 1 |
s |
|
|
|
n i 1 |
s |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
||||
Критическая статистика для проверки нулевой гипотезы |
( 2) |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
4.4.3. Обнаружение гетероскедастичности остатков модели
Рассмотрим график разброса остатков, полученных путем очистки некоторой исходной статистической выборки от ранее вычисленных модельных значений, представленный на рисунке 4.5.
По оси ординат откладывались значения остатков ei , по оси абсцисс значения Yˆi . Очевидно, остатки не имеют постоянной дисперсии: вариация остатков растет с увеличением Ŷi. Это значит, что нарушена одна из предпосылок применения МНК, а именно D i 2 , i 1, n , что свидетельствует о наличии гетероскедастичности (heteroskedasticity) в
остатках |
( D i |
i2 ), |
иначе |
говоря, |
|
случайная |
составляющая |
|
имеет |
||
распределение неоднородное по характеристике случайного разброса. |
|
|
|||||||||
|
ei |
|
|
|
|
|
|
|
|
|
|
900 |
|
|
|
|
|
|
|
|
|
|
|
400 |
|
|
|
|
|
|
|
|
|
|
|
-100 |
|
|
|
|
|
|
|
|
|
|
Y |
0 |
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
100 |
|
-600 |
|
|
|
|
|
|
|
|
|
|
|
Рисунок 4.5 - Пример проявления тенденции в остатках регрессионной модели.
Различают чистую (наблюдается в правильно специфицированных уравнениях) и нечистую (вызвана ошибками спецификации, например, пропуск существенной переменной) гетероскедастичность.
Чистая гетероскедастичность не приводит к смещению оценок, в
отличие от ошибки спецификации. Она имеет много форм проявления. Очень
часто |
её |
моделируют |
посредством |
коэффициента |
(фактора) |
|||
пропорциональности, например, |
D i 2 Pi |
2 , |
где i |
|
, а P |
- фактор |
||
1, n |
||||||||
пропорциональности (proportionality factor) – автономная переменная, в общем случая невходящая в число экзогенных факторов модели.
Применение МНК в случае «нечистой» гетероскедастичности в
остатках не позволяет получить состоятельные оценки параметров; полученные оценки также не являются эффективными; гетероскедастичность приводит к смещенности оценок регрессионных коэффициентов, т.е. если распределение случайной составляющей не является гомоскедастичным, то расчет стандартных ошибок параметров с помощью МНК будет неточен [1, 2, 4, 11, 14-16].
В любом случае гетероскедастичность ведёт к росту дисперсии распределений оценок коэффициентов модели и вызывает занижение стандартных ошибок МНК-оценок (если дисперсия случайной положительно коррелирована с абсолютными значениями наблюдений, что наиболее характерно на практике). Следовательно, в этом случае стоит осторожно относиться к выводам, сделанным на основе статистики Стьюдента и Фишера.
Для обнаружения гетероскедастичности, помимо визуального анализа облака разброса случайной компоненты ряда, можно использовать большое количество спецификационных тестов, поясним ряд наиболее эффективных и популярных тестов:
обобщённый тест Уайта (White H.);
Бреуша-Пагана (Breusch T., Pagan A.);
ранговой корреляции Спирмэна (Spearman C.E.);
Голдфелда-Квандта (Goldfeld S., Quandt R.);
Парка (Park R.);
Глейзера (Glejser H.) и др.
В основе этих критериев обычно лежат различные предположения о зависимости между дисперсией случайного возмущения ряда и величиной объясняющих переменных. В этой связи одним из наиболее полезных тестов на гетероскедастичность признан тест Уайта, т.к. он не требует предварительных предположений о форме распределения остаточных компонент.
