- •Лекция 1. Предмет эконометрики. Особенности эконометрического метода. Этапы эконометрического исследования и построения эконометрической модели.
- •Особенности эконометрического метода.
- •Лекция 2. Парная регрессия. Суть регрессионного анализа. Линейная регрессия и корреляция, смысл и оценка параметров. Метод наименьших квадратов (мнк). Свойства оценок мнк.
- •Линейная регрессия и корреляция: смысл и оценка параметров
- •Коэффициент регрессии в функции потребления.
- •Лекция 3. Проверка качества уравнения регрессии. Показатели качества регрессии.
- •Оценка существенности линейной регрессии и корреляции
Лекция 2. Парная регрессия. Суть регрессионного анализа. Линейная регрессия и корреляция, смысл и оценка параметров. Метод наименьших квадратов (мнк). Свойства оценок мнк.
Цель лекции: ознакомить студентов с сутью корреляционно-регрессионного анализа, с линейными моделями регрессии в экономических задачах, построением их и оценкой параметров.
Парная регрессия, суть регрессионного и корреляционного анализа
Чтобы дать количественное описание взаимосвязей между экономическими переменными, эконометрика пользуется методами регрессии и корреляции. Существуют две формы анализа линейных взаимосвязей:
корреляционный анализ проверяет наличие и значимость линейной зависимости между переменными, без указания зависимой и объясняющих переменных и оценивания формулы связи;
регрессивный анализ – выделяется зависимая переменная, после чего оценивается и анализируется формула ее зависимости от объясняющих переменных.
В зависимости от качества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.
Простая регрессия (регрессия между двумя переменными y и x) – модель вида
y= (x) ,
где y – зависимая (объясняющая) переменная (результативный признак)
x - независимая (объясняющая) переменная (признак-фактор).
Множественная регрессия (регрессия результативного признака с двумя и большим числом факторов) – модель вида
y= (x1, x2,…, xk).
Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, т.е. с теории, устанавливающей связь между переменными.
Прежде всего из всего круга факторов, влияющих на результативный признак, выделяют наиболее существенные влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.
Пусть выдвигается гипотеза о том, что величина спроса на товар A находится в обратной зависимости от цены X, т.е. x=a-bx.
В этом случае надо знать, какие остальные факторы предполагаются неизменными, возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.
Уравнение простой регрессии устанавливает связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем целом по совокупности наблюдений.
Если y=300-4x, то с ростом цены x на 1 д.е. спрос в среднем уменьшается на 4 д.е. В уравнений регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной математической функцией.
Практически же в каждом отдельном случае величина y складывается из:
yi= xi+Ei,
где yi – фактическое значение результативного призанка;
xi – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции y и x, т.е. из уравнения регрессии;
Ei – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина E называется возмущением, она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
Уравнение зависимости спроса y от цены x точнее записывается так:
y=300-4x+E (E – всегда есть место случайности).
Обратная зависимость может характеризоваться и другими формулами:
x=a*x-b x=a+ x=
К случайным ошибкам относятся:
Ошибки спецификации – неправильный выбор математической функции для x, недоучет в уравнении регрессии какого-либо существенного фактора, т.е. испоьзование парной регрессии вместо множественной. (Так спрос на товар может определяться не только ценой, но и доходом на душу населения).
Ошибки выбора – обусловлены выборочными данными, неоднородностью данных. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата из совокупности исключают единицы с аномальными значениями.
Ошибки измерения – самые опасные ошибки. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выбора – увеличением объема исходных данных, то ошибки измерения более существенны, особенно на макроуровне.
Пример. В настоящее время органы государственной статистики получают балансы предприятий, достоверность которых никто не подтверждает.
Последующее обобщение такой информации может содержать ошибки измерения. Исследуя, например, в качестве результативного признака прибыль предприятий, надо быть уверенным в том, что предприятия показывают в отчетности адекватные реальной дейтсвительности величины.
Полагая, что ошибки измерения сведены к минимуму, основное внимание уделяют ошибкам спецификации модели.
В парной регрессии выбор математической функции x=f(x) осуществляется тремя методами:
графическим
аналитическим
экспериментальным
Графический метод нагляден для подбора вида уравнения регрессии. Основные типы кривых, используемых при количественной оценке связи:
y
y
x=a+bx x=a+bx+cx2
x
0
0
x
y
y
x=a+ x=a+bx+cx2+dx3
0
x
0
x
y
y
x=a*xb x=a*bx
0
x
x
0
и другие.
При компьютерной обработке выбор вида уравнения регрессии осуществляется экспериментальным методом, т.е. путем сравнения величины остаточной дисперсии Дост, рассчитанной при разных моделях.
y
y
x
0
x
0
уравнение регрессии проходит в практике имеет место рассеивание
через все точки корреляционного точек относительно линейной
поля, это возможно только при регрессии (влияние прочих,
функциональной связи Дост=0 не учитываемых в уравнении
регрессии факторов)
Дост= (y- x)2
Лучше подходит уравнение регрессии, где Дост меньше.
Если Дост приблизительно одинаковая для нескольких функций, предпочтение отдается более простым видам функций.
Число наблюдений должно в 6-7 раз превышать число рассчитываемых параметров по переменной x. Это означает, что искать линейную регрессию, имея менее 7 наблюдений, не имеет смысла. Если вид функции усложняется, то требуется увеличение объема наблюдений, т.к. каждый параметр при x должен рассчитываться хотя бы по 7 наблюдениям.
Значит, если мы выбираем параболу x=a+bx+cx2, то требуется объем информации не менее 14 наблюдений. Учитывая, что эконометрические модели часто строятся по данным рядов динамики, ограниченным по протяженности (10, 20, 30 лет), при спецификации модели предпочтительнее модель с меньшим числом параметров при x.