Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЭКОНОМЕТРИКА и математическая экономика / Эконометрика. Учебник продвинутый (2005)

.pdf
Скачиваний:
512
Добавлен:
20.04.2015
Размер:
4.02 Mб
Скачать

5.2. Производные измерения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

193

а) если y = x1 ± x2 , то: g =

1

, σy2 = σ12 + σ22 ± 2ω.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

±1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) если y = x1x2 , то: g =

 

 

x2

 

, σ2 = x2σ2 + x2σ2 + 2x1x2ω или

σy2

 

=

σ12

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

2

1

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

σ2

+ 2

ω

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

x1x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

x2

 

 

 

σ2

 

 

σ2

 

 

σ2

 

в) если y =

x1

x2

 

2

1

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

 

 

y

 

 

 

1

 

2

 

x2

, то: g =

 

x1

,

σy

=

x22

σ1

+

x24

σ2

2

x23

ω

или

y2

 

=

x12

 

+

x22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

ω

.

 

 

x22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Случаи (б) и (в) можно объединить: если y = x

x±

1

, то

 

σ2

=

σ2

+

 

σ2

 

2

 

ω

 

 

 

 

y

 

1

 

2

±

 

 

 

 

 

 

y2

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

x1

 

 

x2

 

 

x1x2

 

 

 

Можно назвать σy , σ1, σ2 абсолютными, а σyy , σx11 , σx22 — относительными ошибками, и, как только что показано, сделать следующие утверждения.

Если ошибки аргументов не коррелированы ( ω = 0), то квадрат абсолютной ошибки суммы или разности равен сумме квадратов абсолютных ошибок аргументов, а квадрат относительной ошибки произведения или частного от деления равен сумме квадратов относительных ошибок аргументов.

Если ошибки аргументов коррелированы положительно ( ω > 0), то ошибка суммы или произведения возрастает (предполагается, что x1x2 > 0), а разности или частного от деления — сокращается. Влияние отрицательной корреляции ошибок аргументов противоположное.

Выражение (5.4), которое фактически дает формулу ошибки среднего, также является частным случаем (5.16).

Действительно, в данном случае y =

 

 

N

 

 

 

 

 

 

 

1

 

xi , Ω = σ2IN , и поскольку

N

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

1 .

 

 

 

 

2

 

1

 

2

 

g =

 

.

,

то

σ

y

=

 

σ

 

.

 

 

 

 

N

.

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

В случае, если ошибки величин xj не коррелированы друг с другом и имеют одинаковую дисперсию σ2 ( Ω = σ2In ), то

σy2 = σ2g g,

(5.17)

т.е. чем резче меняется значение функции в точке расчета, тем в большей степени ошибки исходной информации влияют на результат расчета. Возможны ситуации, когда результат расчета практически полностью определяется ошибками «на входе».

σy2
σj σj
ωjj

194

Глава 5. Случайные ошибки

В случае, если известны дисперсии ошибок εj , а информация о их ковариациях отсутствует, можно воспользоваться формулой, дающей верхнюю оценку ошибки результата вычислений:

n

σy j gj | = ∆y ,

j=1

где σj — среднеквадратическое отклонение εj .

Пусть в данном случае σ — диагональная матрица j }, тогда Ω = σRσ, где R — корреляционная матрица ( rjj = ).

Тогда (5.16) преобразуется к виду:

= g σRσg.

Пусть далее |σg| — вектор-столбец {|σj gj |}, а W — диагональная матрица 1} такая, что σg = W |σg|.

Тогда

σy2 = |g σ| W RW |σg| .

(5.18)

По сравнению с R в матрице W RW лишь поменяли знаки некоторые недиагональные элементы, и поэтому все ее элементы, как и в матрице R, не превышают единицы:

W RW 1n1n.

Умножение обеих частей этого матричного неравенства справа на вектор-столбец |σg| и слева на вектор строку |g σ| сохранит знак « », т.к. эти векторы, по определению, неотрицательны. Следовательно:

|g σ| W RW |σg|

(5.18)

|g σ| 1n1n |σg| =

2

= σy2

j gj | .

Что и требовалось доказать.

 

 

 

5.3. Упражнения и задачи

Упражнение 1

Дана модель xi = β + εi = 12 + εi, i = 1, . . . , N . Используя нормальное распределение, в котором каждое значение ошибки εi независимо, имеет среднее 0 и дисперсию 2, получите 100 выборок вектора ε размерности (N × 1), k = = 1, . . . , 100 , где N = 10 (в каждой выборке по 10 наблюдений). Прибавив к каждому элементу этой выборки число 12 получите 100 выборок вектора x.

5.3. Упражнения и задачи

195

1.1. Используйте 20 из 100 выборок, чтобы получить выборочную оценку bk

10

для β (bk = 101 i=1 xik, k = 1, . . . , 20).

1.2. Вычислите

среднее

и

дисперсию для 20 выборок оценок параметра β

20

 

2

 

1

20

 

2

 

 

1

 

 

 

 

 

 

 

 

b =

 

k=1 bk , s

 

=

 

k=1 (bk − b)

 

 

. Сравните эти средние значения с ис-

20

 

201

 

 

тинными параметрами.

 

 

 

 

 

 

 

1.3. Для каждой из 20 выборк оцените дисперсию, используя формулу

 

 

 

 

 

 

 

1

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sˆ2 =

 

i=1 (xi b)2.

 

 

 

 

 

 

 

 

 

N − 1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

20

ввыборке k. Рассчитайте 20 k=1 и сравните

систинным значением.

1.4.Объедините 20 выборок по 10 наблюдений каждая в 10 выборок по 20 наблюдений и повторите упражнение 1.1–1.3. Сделайте выводы о результатах увеличения объема выборки.

1.5.Повторите упражнение 1.1–1.3 для всех 100 и для 50 выборок и проанализируйте разницу в результатах.

1.6.Постройте распределения частот для оценок, полученных в упражнении 1.5, сравните и прокомментируйте результаты.

1.7.Постройте 95 % доверительный интервал для параметра β в каждой выбор-

ке, сначала предполагая, что σ2 известно, а потом при условии, что истинное значение σ2 неизвестно. Сравните результаты.Пусть sˆ2k sˆ2k— это оценка σ2

Задачи

1.При каких условиях средний за ряд лет темп инфляции будет несмещенной оценкой истинного значения темпа инфляции?

2.В каком случае средняя за ряд лет склонность населения к сбережению будет несмещенной оценкой истинного значения склонности к сбережению?

3.Пусть x1, x2, . . . , xN — независимые случайные величины, распределен-

ные нормально с математическим ожиданием β и дисперсией σ2 .

N

 

 

ixi

Пусть b =

i=1

 

— это оценка β,

N

 

 

 

i

i=1

196

Глава 5. Случайные ошибки

покажите, что b — относится к классу несмещенных линейных оценок;

рассчитайте дисперсию b ;

проверьте b на состоятельность;

N

сравните b с простой средней b = N1 i=1 xi;

4.Случайная величина измерена три раза в неизменных условиях. Получены

значения: 99, 100, 101. Дать оценку истинного значения этой величины

и стандартную ошибку данной оценки.

5.Измерения веса студента Иванова на четырех весах дали следующие результаты: 80.5 кг, 80 кг, 78.5 кг, 81 кг. Дайте оценку веса с указанием ошибки измерения.

6.Пусть β — величина ВВП в России в 1998 г. Несколько различных экспертов рассчитали оценки ВВП xi. Какие условия для ошибок этих оценок xi −β должны выполнятся, чтобы среднее xi было несмещенной и эффективной оценкой β?

7.Проведено пять измерений некоторой величины. Результаты этих измерений следующие: 5.83, 5.87, 5.86, 5.82, 5.87 . Как бы вы оценили истинное значение этой величины при доверительной вероятности 0.95 ? А при вероятности

0.99 ?

8.Предположим, что исследователь, упоминавшийся в задаче 7, полагает, что истинное стандартное отклонение измеряемой величины равно 0.02. Сколько независимых измерений он должен сделать, чтобы получить оценку значения величины, отличающуюся от истинного значения не более чем на 0.01:

а) при 95%-ном доверительном уровне?

б) при 99%-ном доверительном уровне?

9. Случайная величина измерена три раза в неизменных условиях. Получена оценка истинного значения этой величины 5.0 и стандартная ошибка этой

1

оценки . Каким мог быть исходный ряд?

3

10.Пусть имеется 25 наблюдений за величиной x, и по этим данным построен 95%-ный доверительный интервал для x: [1.968; 4.032]. Найдите по этим данным среднее значение и дисперсию ряда.

11.Пусть xi — продолжительность жизни i-го человека ( i = 1, . . . , N ), x — средняя продолжительность жизни, элементы выборки случайны и независимы. Ошибка измерения исходного показателя для всех i составляет 5%,

5.3. Упражнения и задачи

197

какова ошибка x ? Вывести формулу σx2¯, рассчитать коэффициент вариации для x, если x1 = 50, x2 = 60, x3 = 70.

12.Пусть объем экспорта равен 8 условных единиц, а импорта — 7 условных единиц. Показатели некоррелированы, их дисперсии одинаковы и равны 1 условной единице. На каком уровне доверия можно утверждать, что сальдо экспорта-импорта положительно?

13.Средние рентабельности двух разных фирм равны соответственно 0.4 и 0.2, стандартные отклонения одинаковы и составляют 0.2. Действительно ли первая фирма рентабельнее и почему?

14.Наблюдаемое значение некоторой величины в предыдущий и данный момент времени одинаково и равно 10. Ошибки наблюдений не коррелированы и имеют одинаковую дисперсию. Какова относительная ошибка темпа роста?

15.Пусть величина ВНП в I и II квартале составляла соответственно 550 и 560 млрд. долларов. Ошибки при расчетах ВНП в I и II квартале не коррелированы и составляют 1%. Какова относительная ошибка темпа прироста ВНП во II квартале? К каким последствиям в расчетах темпов роста и темпов прироста приведут ошибки измерения ВНП, равные 5%?

16.Стандартная ошибка измерения показателя труда и показателя капитала составляет 1%, ошибки измерений не коррелированы. Найти относительную ошибку объема продукции, рассчитанного по производственной функции Кобба—Дугласа: Y = CKαLβ .

17.Доля бюджетного дефицита в ВВП вычисляется по формуле (R − E)/Y , где

R = 600 условных единиц — доходы бюджета, E = 500 условных единиц — расходы, Y = 1000 условных единиц — ВВП. Известно, что дисперсии R и E равна 100, дисперсия Y равна 25. Оценить сверху дисперсию доли дефицита.

Рекомендуемая литература

1.Венецкий И.Г., Венецкая В.И. Основные математико-статистические понятия и формулы в экономическом анализе. — М.: «Статистика», 1979. (Разд. 7).

2.Езекиэл М., Фокс К. Методы анализа корреляций и регрессий. — М.: «Статистика», 1966. (Гл. 2).

198

Глава 5. Случайные ошибки

3.Кейн Э. Экономическая статистика и эконометрия. — М.: «Статистика», 1977. Вып. 1. (Гл. 8, 9).

4.Моргенштерн О. О точности экономико-статистических наблюдений. — М.: «Статистика», 1968. (Гл. 2, 6).

5.Тинтер Г. Введение в эконометрию. — М.: «Статистика», 1965. (Гл. 1).

6.Frees Edward W. Data Analysis Using Regression Models: The Business Perspective, Prentice Hall, 1996. (Ch. 2).

7.(*) Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch. 3, 5).

8.William E.Griffiths, R. Carter Hill., George G. Judge Learning and Practicing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 14).

Глава 6

Алгебра линейной регрессии

6.1. Линейная регрессия

В этой главе предполагается, что между переменными xj , j = 1, . . . , n существует линейная зависимость:

n

xj αj = β + ε,

(6.1)

j=1

где αj , j = 1, . . . , n, β (угловые коэффициенты и свободный член) — параметры (коэффициенты) регрессии (их истинные значения), ε — случайная ошибка; или в векторной форме:

= β + ε,

(6.2)

где x и α — соответственно вектор-строка переменных и вектор-столбец параметров регрессии.

Как уже отмечалось в пункте 4.2, регрессия называется линейной, если ее

уравнение линейно относительно параметров регрессии, а не переменных. Поэтому предполагается, что xj , j = 1, . . . , n, могут являться результатом каких-либо функциональных преобразований исходных значений переменных.

Для получения оценок aj , j = 1, . . . , n, b , e, соответственно, параметров регрессии αj , j = 1, . . . , n, β и случайных ошибок ε используется N наблюдений за переменными x, i = 1, . . . , N , которые образуют матрицу наблюдений X

200

Глава 6. Алгебра линейной регрессии

размерности N × n (столбцы — переменные, строки — наблюдения). Уравнение регрессии по наблюдениям записывается следующим образом:

= 1N β + ε,

(6.3)

где, как и прежде, 1N — вектор-столбец размерности

N , состоящий из еди-

ниц, ε — вектор-столбец размерности N случайных ошибок по наблюдениям;

или в оценках:

 

Xa = 1N b + e.

(6.4)

Собственно уравнение регрессии (без случайных ошибок) = β или xa = b определяет, соответственно, истинную или расчетную гиперплоскость (линию,

плоскость, . . . ) регрессии.

Далее применяется метод наименьших квадратов: оценки параметров регрессии находятся так, чтобы минимального значения достигла остаточная дисперсия:

s2

=

1

e e =

1

a X

b1

(Xa

1 b) .

 

N

e

 

N

 

N

 

N

Из равенства нулю производной остаточной дисперсии по свободному члену b следует, что

 

 

 

 

 

 

xa¯

= b

 

 

 

 

(6.5)

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1N e = 0.

 

 

 

(6.6)

Действительно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂s2

=

2

1

(Xa

 

1

 

b) =

2 (¯xa − b) ,

 

e

 

 

 

 

 

 

 

 

 

 

N

N

 

2

 

 

 

∂b

 

N

 

 

 

 

1

e.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N N

 

Вторая производная по b равна 2, т.е. в найденной точке достигается минимум.

Здесь и ниже используются следующие правила матричной записи результатов дифференцирования линейных и квадратичных форм.

Пусть x, a — вектор-столбцы, α — скаляр, а M — симметричная матрица. Тогда:

dxα

= x,

∂x a

= a,

∂x M

= M,

∂x M x

= 2M x.

∂x

 

∂x

∂x

 

 

 

 

(См. Приложение A.2.2.)

6.2. Простая регрессия

201

Этот результат означает, что точка средних значений переменных лежит на расчетной гиперплоскости регрессии.

В результате подстановки выражения b из (6.5) через a в (6.4) получается другая форма записи уравнения регрессии:

ˆ

(6.7)

Xa = e,

где ˆ — матрица центрированных значений наблюдений.

X = X 1N x¯

(6.3, 6.4) — исходная, (6.7) — сокращенная запись уравнения регрессии.

Минимизация остаточной дисперсии по a без дополнительных условий приведет к тривиальному результату: a = 0. Чтобы получать нетривиальные решения, на вектор параметров α и их оценок a необходимо наложить некоторые ограничения. В зависимости от формы этих ограничений возникает регрессия разного вида — простая или ортогональная.

6.2. Простая регрессия

В случае, когда ограничения на вектор a (α) имеют вид aj = 1 ( αj = 1), возникают простые регрессии. В таких регрессиях в левой части уравнения остается одна переменная (в данном случае j-я), а остальные переменные переносятся в правую часть, и уравнение в исходной форме приобретает вид (регрессия j-й переменной по остальным, j-я регрессия):

 

 

 

 

Xj = X−j a−j + 1N bj + ej ,

 

 

 

 

(6.8)

где

Xj — вектор-столбец

наблюдений за

j

переменной — объясняемой,

X−j

— матрица наблюдений размерности N × (n − 1)

за остальными перемен-

ными — объясняющими (композиция Xj и X−j

образует матрицу X ), a−j

вектор a без j-го элемента (равного

1), взятый с обратным знаком (компози-

ция 1 и −a−j образует вектор a), bj

и ej

— соответственно свободный член

и вектор-столбец остатков в j-й регрессии. В сокращенной форме:

 

 

 

 

 

 

 

ˆ

ˆ

 

 

 

 

 

 

 

(6.9)

 

 

 

 

 

 

Xj = X−j a−j + ej .

 

 

 

 

 

В таких регрессиях ошибки

eij — расстояния от гиперплоскости регрессии

до точек облака наблюдения — измеряются параллельно оси xj .

 

 

Остаточная дисперсия приобретает следующую форму:

 

 

 

 

 

s2

=

1

e e

=

1

 

Xˆ

a Xˆ

 

Xˆ

Xˆ

a

 

.

(6.10)

 

 

N

−j

 

ej

 

N j j

 

j

−j

−j

j

−j

 

 

 

202

 

 

 

 

 

 

 

Глава

6. Алгебра линейной регрессии

Из равенства нулю ее производных по параметрам a−j

определяется, что

 

 

 

 

 

 

 

 

a−j = Mj1m−j ,

 

(6.11)

где M j =

1

Xˆ

Xˆ

j

— матрица ковариации объясняющих переменных x

j

N

−j

 

 

 

 

 

 

 

 

 

между собой, m−j =

1

Xˆ−j Xˆj — вектор-столбец ковариации объясняющих пе-

N

ременных с объясняемой переменной xj ; и

 

 

 

 

 

 

 

 

 

 

 

cov (X

, e ) =

1

Xˆ

 

e = 0.

(6.12)

 

 

 

 

 

 

 

 

 

 

 

 

 

−j

j

N

−j

j

 

 

 

Действительно,

∂sej2

=

2 ˆ

 

 

X

∂a−j

N

 

ˆ

j

ˆ

 

a

 

=

2(m−j − M−j a−j ),

X

X

−j

−j

 

2

 

 

 

−j

 

 

 

 

Xˆ

e

.

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

−j j

 

Кроме того, очевидно, что матрица вторых производных равна 2M−j , и она, как всякая ковариационная матрица, положительно полуопределена. Следовательно, в найденной точке достигается минимум остаточной дисперсии.

Справедливость утверждения о том, что любая матрица ковариации (теоретическая или ее оценка) положительно полуопределена, а если переменные линейно независимы, то — положительно определена, можно доказать в общем случае.

Пусть x — случайный вектор-столбец с нулевым математическим ожиданием. Его теоретическая матрица ковариации по определению равна E (xx ). Пусть ξ = 0 — детерминированный вектор-столбец. Квадратичная форма

ξ E(xx )ξ = E(ξ xx ξ) = E (ξ x)2 0,

т.е. матрица положительно полуопределена. Если не существует такого ξ = 0, что ξ x = 0, т.е. переменные вектора x линейно не зависят друг от друга, то неравенство выполняется строго, и соответствующая матрица положительно определена.

Пусть X — матрица N наблюдений за переменными x. Оценкой матрицы ко-

вариации этих переменных является

1

Xˆ Xˆ . Квадратичная форма

1

ξ Xˆ Xˆ ξ =

 

 

 

1

 

 

N

N

=

u u 0, где

u = Xˆ ξ, т.е. матрица положительно полуопределена. Если не

 

 

N

ˆ

 

 

 

 

существует такого

 

 

 

 

ξ = 0, что = 0, т.е. переменные x линейно не зависят друг

от друга, то неравенство выполняется строго, и соответствующая матрица положительно определена.

Оператор МНК-оценивания образуется соотношениями (6.11) и (6.5), которые в данном случае записываются следующим образом:

bj = x¯j − x¯−j a−j

(6.13)