Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭКОНОМЕТРИКА.doc
Скачиваний:
11
Добавлен:
18.09.2019
Размер:
1.14 Mб
Скачать

Парная регрессия и корреляция в эконометрических исследованиях. Смысл и оценка параметров.

(слайд 1) Простая регрессия представляет собой модель, где среднее значение результата у рассматривается как функция одной независимой переменной х, т.е. модель вида:

(1)

Парная регрессия применяется, если имеется доминирующий фактор, обуславливающий большую долю изменения изучаемого результативного показателя.

Первое слагаемое f(x) можно интерпретировать как ту часть значения у, которая объяснена уравнением регрессии (1), а второе слагаемое ε – как необъясненную часть значения у (или возмущение). Соотношение между этими частями характеризует качество уравнения регрессии, его способность представлять зависимость между переменными х и у.

(слайд 2) При построении уравнения регрессии ε рассматривается как ошибка модели и представляет собой случайную величину. Наличие этой величины обусловлено такими причинами, как:

  1. наличие дополнительных факторов, оказывающих влияние на переменную у;

  2. неверный вид функциональной зависимости f(х);

  3. ошибки наблюдений и измерений.

Как уже говорилось, различают линейную и нелинейную регрессию. Линейная регрессия описываются уравнением y=a+bx. К нелинейным относятся такие функции, как степенная, полиномиальная, гиперболическая, экспоненциальная и др.

Построение уравнения регрессии

(слайд 3) 1. Постановка задачи

Постановка задачи: по имеющимся данным n наблюдений за совместным изменением двух переменных показателей x и y {(xi,yi), i=1,2,...,n} необходимо определить аналитическую зависимость ŷ = f(x), которая бы наилучшим образом описывала данные наблюдений.

Результаты наблюдений удобно представлять в виде таблицы.

Таблица 2.1

Данные наблюдений

x

y

1

x1

y1

2

x2

y2

n

xn

yn

Каждая строка таблицы представляет собой результат одного наблюдения (xi,yi).

Значения xi, yi из каждой строки можно рассматривать как координаты точки (xi,yi) на координатной плоскости xy. Совокупность всех точек называется поле корреляции, или облако наблюдений, или диаграмма рассеяния (рис. 2.1).

Рис. 2.1. Поле корреляции

Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.

Рис. 2.2. Линия регрессии с минимальной дисперсией остатков

По форме облака наблюдений можно определить вид регрессионной функции. (слайды 4,5)

Для формализации рассмотрим разность между расчетными (теоретическими) и наблюдаемыми значениями у:

Наилучшей считается такая зависимость, для которой сумма квадратов отклонений принимает минимальное значение, т. е. дисперсия стремится к минимуму:

(слайд 7) После постановки задачи, априорного и информационно-статистического этапа проводится спецификации модели.