- •Этапы построения эконометрической модели
- •2. Парная регрессия
- •2.2. Оценка параметров модели
- •2.3. Оценка качества эконометрической модели
- •2.3.1.Коэффициент корреляции
- •2.3.2. Коэффициент детерминации
- •2.3.4. Средняя ошибка аппроксимации
- •2.4.Интервальная оценка функции регрессии и её параметров
- •2.5. Интерпретация результатов моделирования
- •2.6. Прогнозирование неизвестных значений зависимого признака y
- •2.7. Примеры решения задач
- •Линейная модель.
- •Степенная модель.
- •Модель показательной функции.
- •Модель равносторонней гиперболы.
- •2.8. Задачи для самостоятельного решения.
- •2.9. Задание для самостоятельной работы
- •Множественная регрессия
- •3.1. Отбор факторов в модель множественной регрессии
- •3.2. Оценка параметров уравнения множественной регрессии
- •3.3. Множественная корреляция
- •3.4. Коэффициент детерминации
- •3.5. Частные уравнения регрессии
- •3.6. Частные индексы корреляции
- •3.7. Оценка надежности результатов
- •3.8. Пример решения задачи
- •3.9. Задачи для самостоятельного решения.
- •3.10. Задание для самостоятельной работы
- •Моделирование одномерных временных рядов
- •Этапы построения модели временного ряда
- •Спецификация модели
- •Автокорреляция уровней временного ряда
- •Моделирование тенденции временных рядов
- •Моделирование сезонных и циклических колебаний.
- •Тест на обнаружение автокорреляции
- •Пример решения задачи
- •Задачи для самостоятельного решения.
- •Задания для самостоятельной работы.
2.6. Прогнозирование неизвестных значений зависимого признака y
Если модель регрессии значима в целом, предположение о незначимости отклоняется по всем параметрам функции регрессии, не нарушены предпосылки МНК, то модель может быть использована для анализа и прогнозов количественного показателя экономики.
Условно «лучшей» моделью для анализа и прогнозов исследуемого показателя можно считать ту, для которой:
показатель детерминации – выше,
стандартная ошибка – меньше,
доверительный интервал прогноза уже.
Различают точечный и доверительный (интервальный) прогнозы моделируемого показателя (y).
Точечный прогноз
показателя
определяется путем подстановки в
уравнение регрессии
соответствующего прогнозного значения
.
Интервальный прогноз показателя с заданной доверительной вероятностью (P1) имеет вид:
,
где
.
Вычисляется
средняя
стандартная ошибка прогноза
и строится доверительный интервал прогноза
.
2.7. Примеры решения задач
Задача 1. При исследовании 8 магазинов получены следующие данные (табл.3).
Построить регрессионную модель зависимости объема товарооборота от числа работников.
Проверить значимость модели и коэффициентов модели.
Рассчитать коэффициент эластичности и дать ему экономическую интерпретацию.
Построить 95% доверительный интервал для оценки объема товарооборота отдельного магазина со 100 работниками.
Таблица 3. Исходные данные к Задаче 1.
Наблюдение |
Объем товарооборота, млн. руб. |
Число работников |
1 |
0,5 |
73 |
2 |
0,7 |
85 |
3 |
0,9 |
102 |
4 |
1,1 |
115 |
5 |
1,4 |
122 |
6 |
1,4 |
126 |
7 |
1,7 |
134 |
8 |
1,9 |
147 |
Решение:
Проведем спецификацию модели графическим методом.
Поскольку необходимо найти зависимость объема товарооборота от числа работников, то в качестве Y – принимаем Объем товарооборота, X- Число работников.
Рисунок 2. Спецификация модели
На основании поля корреляции можно выдвинуть гипотезу о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Для оценки параметров a и b - используют МНК (метод наименьших квадратов).
Параметры уравнения регрессии.
Выборочные средние:
,
Таблица 4. Расчет параметров модели
|
x |
y |
x2 |
y2 |
x•y |
1 |
73 |
0.5 |
5329 |
0.25 |
36.5 |
2 |
85 |
0.7 |
7225 |
0.49 |
59.5 |
3 |
102 |
0.9 |
10404 |
0.81 |
91.8 |
4 |
115 |
1.1 |
13225 |
1.21 |
126.5 |
5 |
122 |
1.4 |
14884 |
1.96 |
170.8 |
6 |
126 |
1.4 |
15876 |
1.96 |
176.4 |
7 |
134 |
1.7 |
17956 |
2.89 |
227.8 |
8 |
147 |
1.9 |
21609 |
3.61 |
279.3 |
сумма |
904 |
9.6 |
106508 |
13.18 |
1168.6 |
Используя формулы (6) и (7), получаем коэффициенты регрессии:
b = 0.0192, a = -0.97. (b>0, следовательно связь прямая)
Уравнение регрессии: y = 0.0192 x - 0.97,
Величина коэффициента b говорит о том, что с ростом числа работников на 1 человека, объем товарооборота магазина будет увеличиваться на 0,0192 млн. руб.
Теснота связи.
Среднеквадратическое отклонение:
,
Рассчитываем показатель тесноты связи. Таким показателем является линейный коэффициент корреляции, который рассчитывается по формуле:
В нашем примере связь между признаком Y и фактором X (по шкале Чеддока) весьма высокая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Незначительные отклонения в расчетных величинах возможны из-за округления величин.
Коэффициент детерминации.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (модельные) значения результативного показателя y(x) для каждого наблюдения.
=0,9712,
т.е. в 97.12 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 2.88 % изменения Y объясняются факторами, не учтенными в модели.
Таблица 5. Расчет промежуточных величин для оценки качества модели
|
(yi-ycp)2 |
(y- )2 |
(xi-xcp)2 |
|y - |/y |
0.43 |
0.49 |
0.004832 |
1600 |
0.14 |
0.66 |
0.25 |
0.001495 |
784 |
0.0552 |
0.99 |
0.09 |
0.007812 |
121 |
0.0982 |
1.24 |
0.01 |
0.0192 |
4 |
0.13 |
1.37 |
0.04 |
0.000721 |
81 |
0.0192 |
1.45 |
0.04 |
0.002509 |
169 |
0.0358 |
1.6 |
0.25 |
0.009217 |
441 |
0.0565 |
1.85 |
0.49 |
0.002108 |
1156 |
0.0242 |
9.6 |
1.66 |
0.0479 |
4356 |
0.55 |
5. Критерий Фишера.
.
Табличное значение критерия со степенями свободы k1=1 и k2=6 (8-1-1), Fтабл = 5.99
Поскольку фактическое значение Fфакт > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
6. Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
7. Проверка статистической значимости параметров.
Несмещенной оценкой дисперсии возмущений является величина:
- необъясненная
дисперсия (мера разброса зависимой
переменной вокруг линии регрессии).
- стандартная
ошибка оценки (стандартная ошибка
регрессии).
Стандартное отклонение случайной величины a:
Стандартное отклонение случайной величины b:
Поскольку 14.12 > 2.447, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 6.2 > 2.447, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
8. Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежностью 95% будут следующими:
(b – tтабл mb; b + tтабл mb) = (0.0192 - 2.447 • 0.00136; 0.0192 + 2.447 • 0.00136) =
= (0.0158;0.0225)
С вероятностью 95% можно утверждать, что значение данного параметра будет лежать в найденном интервале.
(a – tтабл ma; a + tтабл ma) = (-0.9739 - 2.447 • 0.156; -0.9739 + 2.447 • 0.156) =
= (-1.356;-0.5922)
С вероятностью 95% можно утверждать, что значение данного параметра будет лежать в найденном интервале.
9. Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.
Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.
Коэффициент эластичности находится по формуле:
В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.
10. Интервальный прогноз.
Точечный прогноз
показателя
определяется путем подстановки в
уравнение регрессии
0.0192
x - 0.97 соответствующего прогнозного
значения
=100.
Далее вычисляется средняя стандартная ошибка прогноза :
Строится доверительный интервал прогноза:
Задача 2. Имеются данные о количестве выпускаемой продукции в тыс. штук (x) и ее себестоимостью в у.е. (y).
Таблица 6. Исходные данные к Задаче 2.
№ |
X |
Y |
|
№ |
X |
Y |
1 |
2,50 |
4,40 |
|
8 |
6,00 |
1,50 |
2 |
3,00 |
3,60 |
|
9 |
6,50 |
1,40 |
3 |
3,30 |
3,00 |
|
10 |
7,00 |
1,30 |
4 |
4,00 |
2,70 |
|
11 |
7,50 |
1,20 |
5 |
4,60 |
2,10 |
|
12 |
8,00 |
1,10 |
6 |
5,00 |
1,80 |
|
13 |
8,50 |
1,10 |
7 |
5,40 |
1,90 |
|
14 |
8,90 |
0,90 |
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы.
2.
Оценить каждую модель через среднюю
ошибку аппроксимации
и F-критерий Фишера.
3. Выбрать лучшую модель для прогноза.
Проведем спецификацию модели графическим методом.
Рисунок 3. Поле корреляции к Задаче 2.
Построим линейную и нелинейные регрессии и оценим их качество.
