
- •Аглава определение эконометрики
- •1.1. Предмет эконометрики
- •1.2. Особенности эконометрического метода
- •I продукции на 1 ед. Продукции
- •На 1 ед. Продукции
- •Где Ку я, b — параметры;
- •' 1.3. Измерения в экономике
- •0. Каковы допустимые преобразования на каждой шкале изме рения?глава парная регрессия и корреляция в эконометрических исследованиях
- •2.1. Спецификация модели
- •2.3. Оценка существенности параметров линейной регрессии и корреляции
- •2.4. Интервалы прогноза по линейному уравнению регрессии
- •IfYi пеосм
- •XStudenmund a.N. Using Econometrics: a Practical Guide. — 2-nd Edition, opyright, 1992 by Harper Collins Publishers Inc. - p. 226.
- •Доля расходов на товары длительного пользования в зависимости от дохода семьи
- •1 См., например: Лизер с. Эконометрические методы и задачи / Пер. С англ. - м.: Статистика, 1971. - с. 94.
- •В данном разделе рассматриваются лишь внутренне линейные модели.
- •Где f(X) — первая производная, характеризующая соотношение приростов результата и фактора для соответствующей формы связи.
- •Коэффициенты эластичности для ряда математических фушкций
- •Зависимость рентабельности продукции у (%) от ее трудоемкости х (ч/ед.)
- •1ДжошштДж. Эконометрические метопы / Пер. С англ. — м.: Статистика, 1980. - с. 60.
- •2.6. Корреляция для нелинейной регрессии
- •Индекс детерминации; число наблюдений; число параметров при переменных х.
- •2.7. Средняя ошибка аппроксимации
- •Расчет средней ошибки аппроксимации
- •TГлава множественная регрессия и корреляция
- •3.1• Спецификация модели
- •Потребление; доход;
- •13.2. Отбор факторов при построении
- •Соответствующих факторов.
- •Приведенная форма модели рассматривается в гл. 4
- •3.3. Выбор формы уравнения регрессии
- •См.: Маленво э. Статистические методы эконометрии. — м.: Статис 1975.-с. 138.
- •- Стоимость основных производственных фондов;
- •.4. Оценка параметров уравнения ножественной регрессии
- •3.5. Частные уравнения регрессии
- •3.6. Множественная корреляция
- •Ryxiпарные коэффициенты корреляции результата с каждым фактором.
- •Товаров по региону; х4 - процент увеличения объема продаж фирмы по сравнению с предыдущим годом. /
- •3.7. Частная корреляция
- •Модель фактора X/.
- •3.8. Оценка надежности результатов множественной регрессии и корреляции
- •Коэффициент множественной детерминации для модели с полным набором факторов;
- •Число степеней свободы
- •Сумма квадратов,
- •Dщая Регрессия
- •Отклонений.
- •1 Р с у при неизменном уровне всех других факторов;
- •Включающего все факторы, кроме фактора х(;
- •Р сии с полным набором факторов.
- •3.9. Фиктивные переменные во множественной регрессии
- •1 Подробнее о разных методах построения уравнения множественной регрессии см.: Дрейпер н., Смит г. Прикладной регрессионный анализ. — с. 172-225.
- •2См., например: Ерина а а//Математико-статистические методы изучения экономической эффективности производства. — м.: Финансы и статистика, 1983.
- •Где параметры и случайная составляющая представлены в логарифмах.
- •— Если предприятие находится в остальных районах;
- •— Если предприятие находится в Дальневосточном районе, о — если предприятие находится в остальных районах.
- •Распространенность ручного труда на предприятиях одной отрасли в зависимости от уровня автоматизации производства
- •— Для остальных предприятий;
- •— Для предприятий со средним уровнем автоматизации
- •3.10. Предпосылки метода наименьших квадратов
- •Рйе.3.2. Зависимость случайных остатков в/ от теоретических значений ух
- •'См. Подробно: Статистическое моделирование и прогнозирование: Учеб. Пособие / Под ред. А. Г. Гранберга. — м.: Финансы и статистика, . 1990.-с. 158.
- •И максимальных значениях х; в — максимальная дисперсия остатков при малых значениях х и дисперсия остатков однородна по мере увеличения значений х
- •Рие. 3.6. Гомоскедастичность остатков
- •Рне. 3.8. Гетероскедастичность: большая дисперсия z{ для больших значений ух
- •Районы города
- •165 За строками цифр. - сПб, 1995. - с. 141-145.
- •3.11. Обобщенный метод наименьших квадратов
- •Гомоскедастичности остатков; к{ — коэффициент пропорциональности, меняющийся с изменением величины фактора, что и обусловливает неоднородность дисперсии.
- •В чем смысл обобщенного метода наименьших квадратов?глава системы эконометрических уравнений
- •4.1. Общее понятие о системах уравнений,
- •4.2. Структурная и приведенная формы модели
- •4.3. Проблема идентификации
- •Где у, и у2 — совместные зависимые переменные.
- •4.4. Оценивание параметров структурной модели
- •Где и]уи2 — случайные ошибки приведенной формы модели.
- •Расчетные данные для второго шага дмнк
- •4.5. Применение систем эконометрических уравнений
- •1 См.: Тинтнер г. Введение в эконометрию. - с. 175-176, 267—269.
- •1 См.: Лизер с. Эконометрические методы и задачи. - с. 115.
- •4.6. Путевой анализ
- •» /Глава моделирование одномерных временных рядов1
- •5.1. Основные элементы временного ряда
- •5.2. Автокорреляция уровней временного ряда и выявление его структуры
- •ILiXj-X)(yj-y)
- •5.3. Моделирование тенденции временного ряда
- •Автокорреляционная функция временного ряда темпов роста номинальной месячной заработной платы за 10 месяцев 1999 г., % к уровню декабря 1998 г.
- •5.4. Моделирование сезонных и циклических колебаний
- •Расчет значений сезонной компоненты в аддитивной модели
- •16* Расчет выравненных значений г и ошибок е в аддитивной модели
- •Прибыль компании, тыс. Долл. Сша
- •Расчет выравненных значений т и ошибок е в мультипликативной модели
- •5.5. Моделирование тенденции временного ряда
- •Глава изучение взаимосвязей по временным рядам
- •6.1. Специфика статистической оценки взаимосвязи двух временных рядов
- •6.2. Методы исключения тенденции
- •Результаты расчета параметров линейных трендов расходов на конечное потребление и совокупного дохода
- •Расчет критерия Дарбина — Уотсона дм модели зависимости потребления от дохода
- •6.4.Оценивание параметров уравнения регрессии при наличии автокорреляции в остатках
- •6.5. Коинтеграция временных рядов
- •7.2. Интерпретация параметров моделей с распределенным лагом
- •7.3. Изучение структуры лага и выбор вида модели с распределенным лагом
- •7.4. Модели адаптивных ожиданий
- •7.5. Оценка параметров моделей авторегрессии
- •7.6. Новые направления в анализе многомерных временных рядов
- •В чем сущность моделей рациональных ожиданий? Какова специфика оценки их параметров?литература
- •.Предметный указатель
- •6Оглавление
- •Isbn 5-279-01955-0
- •Эконометрика
2.3. Оценка существенности параметров линейной регрессии и корреляции
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b — 0, и, следовательно, фактор х не оказывает влияния на результату.
Непосредственному расчету /"-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части — «объясненную» и «необъясненную»:
Z(y-y)2 = Ъ$х-у)2 + Ъ(у-$х)2 (2.11)
Общая сумма Сумма квадратов Остаточная сумма квадратов = откл оне н и й, + квадратов отклонений объясненная отклонений
регрессией
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения у вызвана влиянием множества причин. Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ох и У = у. Тогда вся дисперсия ^результативного признака обусловлена воздействием прочих ^факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная /регрессией, совпадает с общей суммой квадратов.
Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора т. е. регрессией у по х, так и вызванный 'действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обуслов- , ленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у. Это равносильно то- \му, что коэффициент детерминации г2^ будет приближаться к ^единице.
Любая сумма квадратов отклонений связана с числом степеней свободы (df — degrees of freedom), т. е. с числом свободы неза- вйсимого варьирования признака. Число степеней свободы связано с числом единиц совокупности лис числом определяемых по ней констант. Применительно к исследуемой проблеме число ; степеней свободы должно показать, сколько независимых отклонений из п возможных [(у{ — у), (у2 - у), (уп — У)] требуется для образования данной суммы квадратов. Так, для общей суммы ' квадратов — У)2 требуется (п — 1) независимых отклонений, ибо по совокупности из п единиц после расчета среднего уровня свободно варьируют лишь (п — 1) число отклонений. Например, имеем ряд значений у: 1, 2, 3, 4, 5. Среднее из них равно 3, и тогда п отклонений от среднего составят: —2; —1; 0; 1; 2. Так как — У) ~ 0, то свободно варьируют лишь четыре отклонения, а пятое отклонение может бьггь определено, если предыдущие четыре известны.
49
4-3117
зультативного признака ух, найденные по линии регрессии: у х = а + b • х.
В линейной регрессии Е(ух — у)2 = Ь2 • Е(х — х )2. В этом нетрудно убедиться, обратившись к формуле линейного коэффициента корреляции:
^ = - (2.12) Gy
Из формулы (2.12) видно, что
—2
2 l2
r*y=b-jT> (2.13)
у
где а2у - общая дисперсия признака у;
Ь2 • а2х — дисперсия признака у, обусловленная фактором х.
4
Соответственно сумма квадратов отклонений, обусловленных линейной регрессией, составит:
»
Поскольку при заданном объеме наблюдений по х и у факторная сумма квадратов при линейной регрессии зависит только от одной константы коэффициента регрессии b, то данная сумма квадратов имеет одну степень свободы. К этому же выводу придем, если рассмотрим содержательную сторону расчетного значения признака у, т. е. рх. Величина ух определяется по уравнению линейной регрессии: ух = а + b * х. Параметр а можно определить как а — У — b-x. Подставив выражение параметра а в линейную модель, получим:
«
ух = У — Ь-х + Ь-х = у — 6 • (х — Зс).
Отсюда видно» что при заданном наборе переменных у их расчетное значение ух является в линейной регрессии функцией только одного параметра — коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1.
Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет п — 2. Число степеней свободы для общей суммы
л-1
(2.14)
п - 1 - 1 + (п - 2).
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D.
Аящ -
D
факт
1
п-2
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину ^-отношения (F-критерий)
:
(2.15)
D
ос
т
ост*
4*
Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений /'-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение /^-критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-от-
ношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: /фает > #0 отклоняется.
Если же величина окажется меньше табличной Гф^ < то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может бцть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Я0 не отклоняется.
В рассматриваемом примере:
4
1(у - Л2 = 2У - л • у2 = 99700 - 7 • ПО2 = 15 ООО - общая сумма квадратов;
Wx ~ У)2 =* ЛХ* - * )2 = 36'84*" (80 - 7 (22:7)2) = 14 735 - факторная сумма квадратов;
Рх)2 = ООО — 14 735 = 265 — остаточная сумма квадратов;
Ъфакт = 14 735;
Постат = 265 ^ 5 = 53;
F= 14 735 -ь 53 = 278;
Fa - 0,05 = 6,61; /'а-0,01 = 16,26.
Поскольку F^m > Рщавл при 1%-ном, так и при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).
Величина /'-критерия связана с коэффициентом детерминации Л Факторную сумму квадратов отклонений можно представить как
ЗЕФг-У)2-**-о2, -и.
а остаточную сумму квадратов — как
Тогда значение F- критерия можно выразить как
г2
/г= 2). (2.16)
1 -г
0 982
В нашем примере г2 = 0,982. Тогда F=- ' (7 - 2)=273
1 - и,Уо2
(некоторое несовпадение с предыдущим результатом объясняется ошибками округления).
Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 2.2).
Таблица 2.2 Дисперсионный анализ результатов регрессии • |
» Число степеней свободы |
Сумма квадратов отклонений |
Дисперсия |
F-отношение |
|
Источники вариации |
на одну степень свободы |
фактиче- . ское |
■ табличное при а = 0,05 |
||
Общая |
6 |
15000 |
— |
|
— |
Объяснен |
|
|
|
|
|
ная |
1 |
14 735 щ |
14 735 |
278 |
6,61 * |
Остаточная |
5 |
265 |
53 |
1 |
. — |
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: тькта.
Стандартная ошибка коэффициента регрессии определяется по формуле
' ш )Z0>-ух)г/(^2) s2
b~i ых-х)2 ii<*-*)2' (2Л7)
|де S2 - остаточная дисперсия на одну степень свободы.
Для нашего примера величина стандартной ошибки коэффициента регрессии составила:
mh - J——— = 2,21. ь V 10,857
Величина стандартной ошибки совместно с /-распределением Стьюдента при п — 2 степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительных интервалов.
Для оценки существенности коэффициента регрессии его величина Сравнивается с его стандартной ошибкой, т. е. определя-
L
ется фактическое значение /-критерия Стьюдента: tb = —, кото
Щ
рое затем сравнивается с табличным значением при определенном уровне значимости а и числе степеней свободы (/7 — 2).
В рассматриваемом примере фактическое значение /-критерия для коэффициента регрессии составило:
36,84 th =—1— = 16,67.
b 2,21
2
_
= л/278 = 16,67. Покажем справедливость равенства — F:
t2^b2 =ьг/иУ~Ух)2/(п-2)= &2-1(с-ЗсУ
2 / ЫУ-УХ)2/(П-2)
Т,(У-УХ)2 4кг
(й-2)
При 1а — 0,05 (для двустороннего критерия) и числе степеней свободы 5 табличное значение tb = 2,57. Так как фактическое значение /-критерия превышает табличное, то, следовательно, гипотезу о несущественности коэффициента регрессии можно отклонить. Доверительный интервал для коэффициента регрессии определяется как b ± / • mb. Для коэффициента регрессии b в примере 95 %-ные границы составят:
36,84 ± 2,57 • 2,21 = 36,84 ± 5,68,
т. е.
31,16 <42,52.
Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, то доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, —10 < ft < 40. Такого рода запись указывает, что истинное значе-
Vi
ние коэффициента регрессии одновременно содержит положительные и отрицательные величины й даже ноль, чего не может $ыть.
Стандартная ошибка параметра
а
определяется по формуле:
L*
IX
=
Is2-
г
А
т
гт\2
—\2
(2.18)
П-2 wl(x-3c
)
Процедура оценивания существенности данного параметра |te отличается от рассмотренной выше для коэффициента регрес-
а
,
его величина сравнивается
т
табличным значением при df-n-2 степенях свободы. Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции т
^
1—г
(2.19)
ftlr
=
2
Фактическое значение /-критерия Стьюдента определяется
£ак
(2.20)
л/l^r
Данная формула свидетельствует, что в парной линейной рег-
(/1-2).
Кроме
л
г
Грессии = F, ибо, как уже указывалось, F =
того, = F. Следовательно, -
Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.
В рассматриваемом примере /г не совпало с tb в результате ошибок округлений. Величина /г - 16,73 значительно превышает табличное значение 2,57 при а = 0,05. Следовательно, коэффициент корреляции существенно отличен от нуля и зависимость является достоверной.
Рассмотренная формула оценки коэффициента корреляции рекомендуется к применению при большом числе наблюдений и если г не близко к + 1 или -1. Если же величина коэффициент
а
корреляции близка к + 1, то распределение его оценок отличается от нормального или распределения Стьюдента, так как величина коэффициента корреляции ограничена значениями от — 1 до +1. Чтобы обойти это затруднение, Р. Фишером было предложено для оценки существенности г ввести вспомогательную величину z, связанную с коэффициентом корреляции следующим отношением:
1
. 1+г
тг
=
При изменении г от — 1 до +1 величина z изменяется от —оо до +оо, что соответствует нормальному распределению. Математический анализ доказывает, что распределение величины z мало отличается от нормального даже при близких к единице значениях коэффициента корреляции. Стандартная ошибка величины z определяется по формуле
1
V^T <2-22>
где п — число наблюдений.
При г =0,991, г = 0,5 • ln[( 1 + 0,991) : (1 - 0,991)] = 2,699, а mz = 1:7(7-3) =0,5. Величину z можно не рассчитывать, а воспользоваться готовыми таблицами ^-преобразования, в которых приведены значения величины z для соответствующих значений г.
Далее выдвигаем нулевую гипотезу #0, которая состоит в том, что корреляция отсутствует, т. е. теоретическое значение коэффициента корреляции равно нулю. Коэффициент корреляции зна-
z
чимо отличен от нуля, если — = > 'а=о,о5> т. е. если фактическое
значение tz превышает его табличное значение на уровне значимости а — 0,05 или а = 0,01.
Иными словами, если z■ 3 > /а=005, то коэффициент кор-
реляции значимо отличен от нуля, что имеет место в рассмотренном примере:
г • 4гП = 2,699л/7^3 = 5,398 при /а= 0,05 = 2,57
Ввиду того, что г и z связаны между собой приведенным выше соотношением, можно вычислить критические значения г, соответствующие каждому из значений z. Таблицы критических значений г разработаны для уровней значимости 0,05 и 0,01 и соответствующего числа степеней свободы. Критические значения г предполагают справедливость нулевой гипотезы, т. е. г мало отлично от нуля. Если фактическое значение коэффициента корреляции по абсолютной величине превышает табличное, то данное значение г считается существенным. Если же г оказывается меньше табличного, то фактическое значение г несущественно.
В рассматриваемом примере при числе степеней свободы /1 — 2 = 5 критическое значение г при а = 0,05 составляет 0,754, а при а — 0,01 составляет 0,874, что ниже фактической величины г^ = 0,991. Следовательно, как было уже доказано, полученное значение г существенно отлично от нуля.
г