к паре
.docxМатрица рангов.
ранг X, dx |
ранг ei, dy |
(dx - dy)2 |
1 |
7 |
36 |
2 |
10 |
64 |
3 |
3 |
0 |
4 |
15 |
121 |
5 |
11 |
36 |
6 |
6 |
0 |
7 |
13 |
36 |
8 |
8 |
0 |
9 |
14 |
25 |
10 |
5 |
25 |
11 |
9 |
4 |
12 |
16 |
16 |
13 |
4 |
81 |
14 |
1 |
169 |
15 |
2 |
169 |
16 |
12 |
16 |
136 |
136 |
798 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы: Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно. По формуле вычислим коэффициент ранговой корреляции Спирмена. Связь между признаком ei и фактором X слабая и обратная Оценка коэффициента ранговой корреляции Спирмена. Значимость коэффициента ранговой корреляции Спирмена Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку: где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2. Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь. По таблице Стьюдента находим t(α/2, k) = (0.05/2;14) = 2.145 Поскольку Tkp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая. Проверим гипотезу H0: гетероскедастичность отсутствует. Поскольку 2.145 > 0.56, то гипотеза об отсутствии гетероскедастичности принимается. 3. Тест Голдфелда-Квандта. В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению xi переменной X в этом наблюдении, т.е. σ2i = σ2x2i , i = 1,2,…,n. Тест Голдфелда-Квандта состоит в следующем: 1. Все n наблюдений упорядочиваются по величине X. 2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k. 3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений). 4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика: F = S3/S1 Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = (n – c - 2m)/2. 5. Если F > Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется. Этот же тест может использоваться при предположении об обратной пропорциональности между σi и значениями объясняющей переменной. При этом статистика Фишера имеет вид: F = S1/S3 1. Упорядочим все значения по величине X. 2. Находим размер подвыборки k = (16 - 4)/2 = 6. где c = 4n/15 = 4*16/15 = 4 3. Оценим регрессию для первой подвыборки. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑x = ∑y a0∑x + a1∑x2 = ∑y•x Для наших данных система уравнений имеет вид: 6a0 + 21a1 = 1246 21a0 + 91a1 = 5198 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 47.83, a1 = 40.27
x |
y |
x2 |
y2 |
x • y |
y(x) |
(y-y(x))2 |
1 |
126 |
1 |
15876 |
126 |
88.1 |
1436.77 |
2 |
137 |
4 |
18769 |
274 |
135.92 |
1.16 |
3 |
148 |
9 |
21904 |
444 |
183.75 |
1278.23 |
4 |
191 |
16 |
36481 |
764 |
231.58 |
1646.81 |
5 |
274 |
25 |
75076 |
1370 |
279.41 |
29.26 |
6 |
370 |
36 |
136900 |
2220 |
327.24 |
1828.58 |
21 |
1246 |
91 |
305006 |
5198 |
1246 |
6220.82 |
Здесь S1 = 6220.82 Оценим регрессию для третьей подвыборки. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0n + a1∑x = ∑y a0∑x + a1∑x2 = ∑y•x Для наших данных система уравнений имеет вид: 6a0 + 81a1 = 2052 81a0 + 1111a1 = 27952 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 14.29, a1 = 149.14
x |
y |
x2 |
y2 |
x • y |
y(x) |
(y-y(x))2 |
11 |
321 |
121 |
103041 |
3531 |
306.29 |
216.51 |
12 |
307 |
144 |
94249 |
3684 |
320.57 |
184.18 |
13 |
331 |
169 |
109561 |
4303 |
334.86 |
14.88 |
14 |
345 |
196 |
119025 |
4830 |
349.14 |
17.16 |
15 |
364 |
225 |
132496 |
5460 |
363.43 |
0.33 |
16 |
384 |
256 |
147456 |
6144 |
377.71 |
39.51 |
81 |
2052 |
1111 |
705828 |
27952 |
2052 |
472.57 |
Здесь S3 = 472.57 Число степеней свободы v1 = v2 = (n – c - 2m)/2 = (16 - 4 - 2*1)/2 = 5 Fkp(5,5) = 6.61 Строим обратную F-статистику: F = 6220.82/472.57 = 13.16 Поскольку F > Fkp = 6.61, то гипотеза об отсутствии гетероскедастичности отклоняется. Проверка на наличие автокорреляции остатков. Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями. Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных. В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов. Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето). Среди основных причин, вызывающих автокорреляцию, можно выделить следующие: 1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию. 2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью. 3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). 4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции. Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными. Обнаружение автокорреляции 1. Графический метод Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения εi с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения εi (либо оценки отклонений). Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции. Автокорреляция становится более наглядной, если построить график зависимости εi от εi-1 2. Коэффициент автокорреляции. Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки. Стандартная ошибка коэффициента корреляции рассчитывается по формуле: Коэффициенты автокорреляции случайных данных должны обладать выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным Если коэффициент автокорреляции первого порядка r1 находится в интервале: -2.228 • 0.25 < r1 < 2.228 • 0.25 то можно считать, что данные не показывают наличие автокорреляции первого порядка. Используя расчетную таблицу, получаем: Так как -0.557 < r1 = 0.0248 < 0.557, то свойство независимости остатков выполняется. Автокорреляции отсутствует. 3. Критерий Дарбина-Уотсона. Этот критерий является наиболее известным для обнаружения автокорреляции. При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
y |
y(x) |
ei = y-y(x) |
e2 |
(ei - ei-1)2 |
126 |
154.36 |
-28.36 |
804.41 |
0 |
137 |
102.49 |
34.51 |
1191.22 |
3953.42 |
148 |
159.02 |
-11.02 |
121.38 |
2073.12 |
191 |
239.1 |
-48.1 |
2313.48 |
1375.02 |
274 |
238.18 |
35.82 |
1282.97 |
7042.11 |
370 |
344.39 |
25.61 |
655.94 |
104.19 |
432 |
389.84 |
42.16 |
1777.23 |
273.76 |
445 |
415.82 |
29.18 |
851.73 |
168.29 |
367 |
414.88 |
-47.88 |
2292.33 |
5938.66 |
367 |
343.25 |
23.75 |
564.14 |
5130.83 |
321 |
350.25 |
-29.25 |
855.42 |
2808.9 |
307 |
358.31 |
-51.31 |
2632.54 |
486.68 |
331 |
354.68 |
-23.68 |
560.62 |
763.46 |
345 |
341.88 |
3.12 |
9.71 |
717.93 |
364 |
355.45 |
8.55 |
73.16 |
29.56 |
384 |
347.12 |
36.88 |
1360.37 |
802.57 |
|
|
|
17346.66 |
31668.49 |
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона: Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 16 и количества объясняющих переменных m=5. Автокорреляция отсутствует, если выполняется следующее условие: d1 < DW и d2 < DW < 4 - d2. Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 < 1.83 < 2.5, то автокорреляция остатков отсутствует. Для более надежного вывода целесообразно обращаться к табличным значениям. По таблице Дарбина-Уотсона для n=16 и k=5 (уровень значимости 5%) находим: d1 = 0.62; d2 = 2.15. Поскольку 0.62 < 1.83 и 2.15 > 1.83 < 4 - 2.15, то автокорреляция остатков присутствует. Решение было получено и оформлено с помощью сервиса: