- •Теоретический минимум Основные понятия эконометрики
- •Элементы корреляционно-регрессионного анализа Основные понятия корреляционного анализа
- •Понятие о регрессионной модели
- •Задачи корреляционно-регрессионного анализа
- •Линейная парная регрессия
- •Метод наименьших квадратов
- •Модель множественной регрессии
- •Нелинейная эмпирическая регрессия
- •Эконометрический анализ при нарушении классических предположений. Временные ряды Основные проблемы при нарушении классических предположений
- •Мультиколлинеарность
- •Автокорреляция
- •Гетероскедастичность
- •Временные ряды
- •Системы одновременных уравнений
Линейная парная регрессия
По выборке ограниченного объема можно искать регрессионную зависимость в определенном виде, например, в виде линейной зависимости:
|
(1) |
где
– оценка
условного математического ожидания
;
и
–
оценки
неизвестных параметров, называемые
эмпирическими
коэффициентами линейной регрессии,
отклонение
– оценка
теоретического случайного отклонения
.
Модель линейной регрессии (линейное уравнение) является наиболее распространенным (и простым) видом зависимости между экономическими переменными. Кроме того, построенное линейное уравнение может служить начальным этапом эконометрического анализа.
Задачи линейного регрессионного анализа (см. Пример 2):
По имеющимся статистическим данным
,
получить наилучшие оценки неизвестных
параметров;Проверить статистические гипотезы о параметрах модели;
Проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).
Метод наименьших квадратов
Различные выборки
из одной и той же генеральной совокупности
обычно приводят к определению отличающихся
друг от друга оценок. Требуется по
конкретной выборке
,
,
найти оценки
и
неизвестных
параметров уравнения (1) так, чтобы
соответствующая линия регрессии (прямая)
являлась бы наилучшей в определенном
смысле среди всех других прямых. Другими
словами, построенная прямая должна быть
«ближайшей» к точкам наблюдений по их
совокупности. Мерами качества найденных
оценок могут служить определенные
функции отклонений (невязок)
,
.
Рис. 1
Самым распространенным является метод наименьших квадратов (МНК) нахождения коэффициентов (оценок) и уравнения эмпирической линейной регрессии. Согласно МНК эти коэффициенты выбираются таким образом, чтобы минимизировать функцию (сумму квадратов отклонений):
.
Необходимым условием минимума данной функции является равенство нулю ее частных производных по параметрам и , откуда для определения параметров линейной регрессии получаем линейную систему алгебраических уравнений:
Коэффициент называется выборочным коэффициентом регрессии Y на X. Он показывает, на сколько единиц в среднем изменяется переменная Y при увеличении переменной X на одну единицу.
Коэффициент нельзя непосредственно использовать для оценки влияния факторного признака x на результативный признак y из-за различия единиц измерения исследуемых показателей. Для этих целей применяется коэффициент эластичности
,
где
,
– средние значения независимой и
зависимой переменной.
Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак y при изменении факторного признака x на один процент.
Основные положения регрессионного анализа. Теорема Гаусса-Маркова. Оценки параметров регрессионной модели и их свойства
МНК обеспечивает оптимальные свойства оценкам лишь при выполнении следующих основных предпосылок регрессионного анализа:
Математическое ожидание случайного отклонения
равно 0:
для всех наблюдений, т.е. случайное
отклонение в среднем не оказывает
влияния на зависимую переменную.
Дисперсия случайного отклонения постоянна для любого
:
(условие гомоскедастичности —
постоянства дисперсий).Случайные отклонения и
являются независимыми друг от друга,
если
.
Если это условие выполняется, то говорят
об отсутствии автокорреляции. С
учетом выполнения условия 1
,
если
.Случайное отклонение независимо от объясняющих переменных. Обычно это условие выполняется автоматически, если объясняющая переменная
не является случайной в данной модели.Случайное отклонение есть нормально распределенная случайная величина.
Теорема Гаусса-Маркова. Если
регрессионная модель удовлетворяет
предпосылкам 1—4, то оценки
и
имеют наименьшую дисперсию в классе
всех линейных несмещенных оценок.
Таким образом, оценки и полученные по методу МНК являются:
несмещенными, так как , что говорит об отсутствии систематической ошибки в определении положения линии регрессии,
состоятельными, так как дисперсия оценок параметров при возрастании числа
наблюдений стремится к нулю (при
увеличении объема выборки надежность
оценок увеличивается),эффективными, т.е. они имеют наименьшую дисперсию по сравнению с любыми другими оценками данных параметров, линейными относительно величин
.
Требование выполнения предпосылки 5 необходимо для оценки точности уравнения регрессии и его параметров.
Для проверки
гипотезы о
статистической значимости коэффициента
регрессии, т.е. гипотезы
:
,
при конкурирующей (альтернативной)
гипотезе
:
,
используется
t-статистика:
|
|
которая при
выполнении исходных предпосылок модели,
имеет распределение Стьюдента с числом
степеней свободы
,
где
– число наблюдений.
Гипотеза
отклоняется, если
,
где
– требуемый уровень значимости, в
противном случае – принимается.
Если гипотеза принимается, что дает (эмпирическое) основание полагать, что величина Y не зависит от X. В этом случае говорят, что коэффициент статистически незначим. При отклонении коэффициент считается статистически значимым, что дает (эмпирическое) основание наличия определенной линейной зависимости между Y и X.
По аналогичной схеме на основе t-статистики проверяется гипотеза о статистической значимости коэффициента :
.
Для парной регрессии более важным является анализ статистической значимости коэффициента , так как именно он позволяет оценить влияние объясняющей переменной X на зависимую переменную Y.
Пример 2. Для
данных их примера 1: оценить тесноту и
направление связи между переменными с
помощью коэффициента корреляции;
оценить
значимость полученного коэффициента
корреляции по критерию Стьюдента
(уровень
значимости
);
найти уравнение
регрессии У
по X.
Сделать выводы.
Решение.
Будем искать
уравнение регрессии в виде
,
.
Оценим
тесноту и направление связи между
переменными с помощью коэффициента
корреляции
.
Поскольку коэффициент корреляции
положительный, связь прямая. Коэффициент
корреляции близок к единице, связь
сильная.
Для проверки значимости коэффициента корреляции используется t-критерий Стьюдента
.
При уровне значимости
и, учитывая, что в нашем примере количество
степеней свободы равно
,
.
Так как
,
то значение
коэффициента корреляции признается
значимым. Парный
коэффициент детерминации:
.
Это значит, что изменение y
на 81% зависит от изменения исследуемых
факторов, а на долю других факторов
приходится 19% изменения результативного
показателя.
Найдем уравнение регрессии Y по X. Вычисления по МНК удобно выполнять, используя следующую табл. 3.
Таблица 3
i |
xi |
yi |
xixi |
xiyi |
1 |
17 |
12 |
289 |
204 |
2 |
19 |
15 |
361 |
285 |
3 |
20 |
18 |
400 |
360 |
4 |
21 |
20 |
441 |
420 |
5 |
28 |
22 |
784 |
616 |
6 |
30 |
17 |
900 |
510 |
7 |
31 |
19 |
961 |
589 |
8 |
38 |
25 |
1444 |
950 |
9 |
42 |
31 |
1764 |
1302 |
10 |
48 |
30 |
2304 |
1440 |
11 |
45 |
40 |
2025 |
1800 |
12 |
50 |
44 |
2500 |
2200 |
сумма |
389 |
293 |
14045 |
10952 |
среднее |
32,42 |
24,42 |
|
|
Согласно МНК, имеем
Таким образом, эмпирическое уравнение парной линейной регрессии имеет вид
.
Изобразим данную
прямую на корреляционном поле.
Построим эту прямую, например, по
следующим двум точкам
и
.
Коэффициент
показывает,
на какую величину изменятся инвестиции
в данное предприятие, если объем
производства этого предприятия возрастает
на одну единицу.
Воздействие
неучтенных факторов и ошибок наблюдений
определяется с помощью дисперсии
случайных отклонений
.
Несмещенной оценкой этой дисперсии
является выборочная остаточная дисперсия.
Прогнозируемое значении переменной y вычисляется по формуле
.
Данный прогноз является точечным.

(эмпирическое
линейное уравнение регрессии),
,