Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Тема1_1

.pdf
Скачиваний:
16
Добавлен:
23.05.2015
Размер:
594.78 Кб
Скачать

Линейная модель парной регрессии и корреляции

Рассмотрим простейшую модель парной регрессии – линейную регрессию. Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров.

Линейная регрессия сводится к нахождению уравнения вида

yx a b x

или

y a b x .

(1.1)

Уравнение позволяет по заданным значениям фактора x

находить теоретические значения результативного признака y,

подставляя в него фактические значения фактора x .

Чтобы построить уравнение регрессии необходимо оценить ее параметры a и b . Оценку параметров линейной регрессии получим методом наименьших квадратов (МНК). МНК позволяет получить

такие оценки параметров a и b , при которых сумма квадратов

отклонений фактических значений результативного признака y от

теоретических y x минимальна:

n

yx 2

n

 

 

 

yi

i2

min

.

(1.2)

i1

i

i1

 

 

 

 

 

Т.е. из всего множества возможных линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной

Из курса математического анализа известно, что для нахождения минимума функции (1.2), надо вычислить частные производные по

каждому из параметров a и b (которые в данном случае являются

неизвестными) и приравнять их к нулю. Обозначим i2

через

i

 

S a, b , тогда:

 

S a, b y a b x 2 .

 

SaS

b

2 y a b x 0;

2 x y a b x 0.

(1.3)

 

После преобразований получим следующую систему линейных уравнений для оценки параметров a и b :

 

 

 

 

 

 

 

 

a n

b

 

x

 

 

y;

 

 

 

 

 

x y.

 

a x b x2

(1.4)

 

 

 

 

 

 

 

 

Решая систему уравнений (1.4), найдем искомые оценки параметров a и b . Можно воспользоваться следующими готовыми формулами, которые следуют непосредственно из решения системы

(1.4):

a y b x ,

b

cov x, y

 

 

(1.5)

2

,

 

 

x

 

 

cov x, y

______

 

 

 

 

 

 

 

 

 

 

где

y x

y x

 

ковариация

признаков x и y ,

 

____

 

– дисперсия признака x и

 

 

 

x2

x2 x 2

 

 

 

 

 

1

x ,

 

1

y

 

______

1

y x ,

____

1

x2 .

 

x

y

,

y

x

x2

 

n

 

 

n

 

 

 

 

n

 

 

 

n

 

 

Ковариация – числовая характеристика совместного распределения двух случайных величин, равная математическому ожиданию произведения отклонений этих случайных величин от их математических ожиданий. Дисперсия – характеристика случайной величины, определяемая как математическое ожидание квадрата отклонения случайной величины от ее математического ожидания.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.

Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях.

Формально a – значение y при x 0. Если признак-фактор x не может иметь нулевого значения, то вышеуказанная трактовка свободного члена a не имеет смысла, значит, параметр a может не иметь экономического содержания.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого

показателя выступает линейный коэффициент корреляции rxy ,

который можно рассчитать по следующим формулам:

r b

x

 

cov x, y

 

 

 

 

y

x y .

(1.6)

 

xy

 

 

 

 

 

 

 

 

 

Линейный

коэффициент корреляции находится

в пределах:

1 rxy 1. Чем

ближе абсолютное значение

rxy

к

единице, тем

сильнее линейная связь между факторами

(при

rxy 1 имеем

строгую функциональную зависимость).

 

 

 

Близость абсолютной величины линейного коэффициента корреляции к нулю означает отсутствие линейной связи. Тем не менее, при другой (нелинейной) спецификации модели связь между признаками может оказаться достаточно тесной.

Для оценки качества подбора линейной функции рассчитывается

квадрат линейного коэффициента корреляции R2=rxy2 , называемый

коэффициентом детерминации. Коэффициент детерминации

характеризует долю дисперсии результативного признака y ,

объясняемую регрессией, в общей дисперсии результативного

признака:

2

1

 

2

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

rxy

 

 

 

 

 

 

 

 

 

 

2 ,

 

 

 

(1.7)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

где ост2

 

1

 

y yx 2

 

y2

1

y y 2

 

y 2 .

 

,

y2

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Соответственно величина 1 rxy2 характеризует долю дисперсии y ,

вызванную влиянием остальных, не учтенных в модели, факторов.

После того как найдено уравнение линейной регрессии,

проводится оценка значимости как уравнения в целом, так и отдельных его параметров.