
- •Состав безработных по полу в 2010 г.
- •Произвести проверку выполнения условий для получения «хороших» оценок методом наименьших квадратов (мнк).
- •1. С помощью корреляционного анализа осуществим выбор факторных признаков для построения двухфакторной регрессионной модели.
- •Рассчитаем параметры модели.
- •Для характеристики модели определим:
- •Осуществить оценку надежности уравнения регрессии (f- критерий Фишера).
- •Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.
- •Произвести проверку выполнения условий для получения «хороших» оценок методом наименьших квадратов (мнк).
- •7.Рассчитать и построить точечные и интервальные прогнозы результирующего показателя при увеличении на δ и на 2∆ .
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
НЕФТЕКАМСКИЙ ФИЛИАЛ
ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО
ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«БАШКИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Экономико-математический факультет
Кафедра математического моделирования
Контрольная работа
по курсу «Эконометрика»
Выполнил: студент 4 курса
специальности «Финансы и кредит»
экономико-математического факультета,
заочного отделения
группы Э-41з
Ахмадишина Д.Д.
№ зачетной книжки 10434
Проверил: ст. пр. Файдрахманова Г.Ф.
Нефтекамск 2013
Задание №1.
Необходимо: собрать данные (экономические показатели), должно быть не менее 10 наблюдений зависимой переменной (Y) и независимой переменной (Х).
Требуется:
Построить регрессионные модели зависимости Y от X и отобразить на графиках фактические и расчетные данные следующих моделей:
линейной,
степенной,
показательной,
гиперболической.
Оценить каждую модель, определив:
Характеристики модели:
2 (остаточная дисперсия)
rХY (индекс корреляции),
R2 (коэффициент детерминации).
(коэффициент эластичности),
(бета-коэффициент).
Значимость уравнения множественной регрессии в целом (F- критерий Фишера).
Значимость коэффициентов уравнения регрессии (t-критерий Стьюдента).
Произвести проверку выполнения условий для получения «хороших» оценок методом наименьших квадратов (МНК):
Математическое ожидание случайной компоненты равно 0, иначе М(εi)=0. (с помощью t-критерия Стьюдента)
Дисперсия должна быть постоянной, т. е. D(εi)=const=σ2 (с помощью F-критерия Фишера)
Коввариация должна быть равна 0, иначе по формуле: cov(εi,εj) = 0 (с помощью d- критерия Дарбина-Уотсона (D-W)).
Найти Eотн (среднюю относительную ошибку).
Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
Рассчитать прогнозные значения по результативной модели, если прогнозное значение фактора увеличивается на 110% относительно среднего уровня.
Отобразить на графике фактические данные, результаты расчетов и прогноз по результативной модели.
Таблицa №1 «Экономические данные»
Состав безработных по полу в 2010 г.
Муж |
74 |
23 |
15 |
78 |
31 |
46 |
53 |
31 |
59 |
57 |
Всего |
143 |
38 |
30 |
127 |
64 |
75 |
99 |
57 |
107 |
99 |
Данные взяты из сайта Федеральной службы государственной статистики Российской Федерации из сборника «Труд и занятость в России» за 2010 год. Ссылка: http://www.gks.ru/bgd/regl/b10_36/IssWWW.exe/Stg/d1/01-23.htm
Дата обращения: 3 мая 2011 год
СВОДНАЯ ТАБЛИЦА
№ |
Обозначение |
Формула |
Значение |
Примечание |
|||||||||
1 |
Линейная модель |
Степенная модель
|
Показательная модель
|
Гиперболическая модель |
|
||||||||
|
|
|
|
|
|||||||||
|
|
|
|
|
|||||||||
|
В своем виде |
|
|
|
|
|
|||||||
|
В линейном виде |
|
|
|
|
|
|||||||
|
|
3,42 |
0,34 |
1,41 |
137,4 |
|
|||||||
|
1,72 |
0,95 |
0,01 |
-1950,11 |
|
||||||||
|
|
3,42 |
2,20 |
25,42 |
137,74 |
|
|||||||
|
|
1,72 |
0,95 |
1,02 |
-1950,11 |
|
|||||||
2.1.1 |
σ² остаточ. дисп-я |
|
53,50 |
0,0013645 |
0,0038554 |
350,15 |
Чем меньше остаточ. дисп-я, тем лучше регресс. ур-е (явл-ся размерной величиной) |
||||||
2.1.2 |
R² коэф. детерминации |
|
0,97 |
Хор. кач-во подгонки |
0,98 |
Хор. кач-во подгонки |
0,93 |
Хор. кач-во подгонки |
0,78 |
Хор. кач-во подгонки |
0<=R²<=1, чем ближе к 1, тем лучше качество подгонки. |
||
2.1.3 |
rxy индекс корреляции |
|
0,98 |
Связь прямая сильная |
0,99 |
Связь прямая сильная |
0,96 |
Связь прямая сильная |
-0,88 |
Связь обратная сильная |
IrxyI>0,7- сильная связь; >0-связь прямая, <0-обратная. |
||
2.1.4 |
Эyx коэф. эластичности |
|
0,96 |
0,82 |
0,25 |
-0,64 |
Показ-т, на ск-ко % изм-ся результивный признак, при изм-ии факторного на 1 %. |
||||||
2.1.5 |
|
|
0,98 |
0,99 |
0,96 |
-0,88 |
Бета-коэффициент
показывает, на какую часть величины
|
||||||
Средние квадратические ошибки выборки величины y и x |
|
35,43 |
0,21 |
0,21 |
35,43 |
||||||||
|
20,20 |
0,22 |
20,20 |
0,02 |
|||||||||
2.2 |
Значимость урав-я множ-ой регрессии в целом (F-крите-рий Фишера) |
|
226,61 |
Линейная связь есть |
807,60 |
Линейная связь есть |
108,25 |
Линейная связь есть |
27,84
|
Линейная связь есть |
Если Fтаб.=5,32 <Fрасч., то H0 :об отсутствии линейной связи между X и Y отвергаем с вероятностью 95%.n1=1,n2=n-2
|
||
2.3 |
Значимость коэф. ур-я регресссии (t-критерий Стьюдента) |
|
26,40 |
Х влият на У сущ-но |
17,90 |
Х влият на У сущ-но |
10,40 |
Х влият на У сущ-но |
-5,28 |
Х влият на У сущ-но |
Если tрасч. > tтаб=2,31, то x влияет на у существенно, т.е.b не равно 0, с заданной вероятностью p. Для tтаб используется степень свободы n-2. |
||
Стандартная ошибка коэффициента |
|
0,07 |
0,05 |
0,00097 |
369,56 |
||||||||
2.4.1 |
|
|
1,88 |
1,93 |
10,40 |
1,93 |
Проверяем
нулевую гипотезу о том, что среднее
арифмет-е знач-е ур-й ряда остатков по
модулю равно нулю ( |
||||||
Среднее квадрат-е отклонение |
|
8,84 |
0,05 |
0,08 |
23,06 |
||||||||
Среднее арифмет-е знач-е уровней ряда |
|
5,25 |
0,03 |
0,05 |
14,09 |
||||||||
2.4.2. |
|
|
3,87 |
3,50 |
4,77 |
2,68 |
Если Fтаб.=6,39 >Fрасч., то : об увел-ии дисперсии принимаем с вероятностью 95%. Для Fтаб исп-ся степени свободы n1=1n/2-1, n2=n/2-1 |
||||||
2.4.3 |
(с пом. d-крите-рия Дарбина-Уотсена (D-W)) |
|
2,77 |
3,41 |
1,48 |
1,92 |
1 |
||||||
d1таб.=1,08d2таб.=1,36 r1таб=0,36 |
|
-0,57 |
-0,79 |
0,26 |
-0,14 |
||||||||
2.5. |
Еотн. (средняя относительная ошибка) |
|
6,32 |
0,23 |
2,55 |
23,10 |
Если Еотн. < 15%, то считается, что модель построена с приемлемой точностью. |
Результатом данной работы стало построение модели состава безработных по полу на 2010 год.
Вывод по линейной модели:
Линейная зависимость имеет вид:
Y= 3,42+1,72*X+ σ2
Показатели качества подгонки свидетельствуют о соответствии расчетных значений фактическим, т.к. дисперсия σ2=53,50 (чем меньше остаточная дисперсия, тем лучше регрессионное уравнение), F=226,61.
Коэффициент детерминации R2=0,97, т.к. он близок к 1, то выше качество подгонки. Это говорит о соответствии регрессионного уравнения реальным данным (т.к. R2→1).
Индекс корреляции rxy=0,98, т.к. он близок к 1, то это говорит о сильной связи между переменными.
Коэффициент эластичности Эху = 0,96, что показывает, на сколько процентов изменится результативный признак (Y), при изменении факторного (X) на 1 %.
Бета-коэффициент = 0,98 показывает, на какую часть величины изменится в среднем значение результативного признака Y, при изменении факторного признака X на величину его среднего квадратического отклонения. Sy = 35,43 и Sx = 20,20.
В ходе выполнения работы были выдвинуты следующие гипотезы:
Об отсутствии линейной связи в результате определения значений F-статистики и сравнениями его с табличными значениями. Данная гипотеза была отвергнута с вероятностью 95%, Fтаб.=5,32 <Fрасч.=226,61, т.е. линейная связь существует.
Гипотеза о несущественном влиянии х на у. После сравнения рассчитанного значения t-статистики и tтаб. Данная гипотеза была отвергнута с вероятностью 95%, так как значимость коэффициента уравнения регресссии (t-критерий Стьюдента) равно 26,40, что говорит о том, что Х влияет на У существенно.
При проверке «хороших» свойств оценки коэффициентов регрессии были выдвинуты следующие гипотезы:
М(Еi)=0 принимается, т.к. tрасч<tтаб (если tрасч.=1,88 > tтаб =2,26 с n-1 степенью свободы, то гипотеза отклоняется с заданной вероятностью.) с вероятностью 95%.
D=const. Проверка показала, что условие не выполняется, т.к. Fрасч<Fтаб, (Fтаб.=6,39 >Fрасч=3,87), т.е.D(Ei) возрастает и не постоянна с вероятностью 95%.
cov(Ej Ei)=0. Расчёты показали присутствие положительной корреляции dрасч = 2,77, т.е. модель адекватна.
Еотн=6,32 % < 15%, т.е. модель построена на высоком уровне точности.
Вывод по степенной модели:
Линейная зависимость имеет вид:
Y= 0,34+0,95*X
Показатели качества подгонки свидетельствуют о соответствии расчетных значений фактическим, т.к. дисперсия σ2=0,0013645 (чем меньше остаточная дисперсия, тем лучше регрессионное уравнении).
Коэффициент детерминации R2=0,98, т.к. он близок к 1, то выше качество подгонки. Это говорит о соответствии регрессионного уравнения реальным данным (т.к. R2→1).
Индекс корреляции rxy=0,99, т.к. он близок к 1, то это говорит о сильной связи между переменными.
Коэффициент эластичности Эху = 0,82, что показывает, на сколько процентов изменится результативный признак (Y), при изменении факторного (X) на 1 %.
Бета-коэффициент = 0,99 показывает, на какую часть величины изменится в среднем значение результативного признака Y, при изменении факторного признака X на величину его среднего квадратического отклонения. Sy = 0,21 и Sx = 0,22.
В ходе выполнения работы были выдвинуты следующие гипотезы:
Об отсутствии линейной связи в результате определения значений F-статистики и сравнениями его с табличными значениями. Данная гипотеза была отвергнута с вероятностью 95%, Fтаб.=5,32 <Fрасч.=807,60, т.е. линейная связь существует.
Гипотеза о несущественном влиянии х на у. После сравнения рассчитанного значения t-статистики и tтаб. Данная гипотеза была отвергнута с вероятностью 95%, так как значимость коэффициента уравнения регресссии (t-критерий Стьюдента) равно 17,90, что говорит о том, что Х влияет на У существенно.
При проверке «хороших» свойств оценки коэффициентов регрессии были выдвинуты следующие гипотезы:
М(Еi)=0 принимается, т.к. tрасч<tтаб (если tрасч.=1,93 > tтаб =2,26, то гипотеза отклоняется с заданной вероятностью.) с вероятностью 95%.
D=const. Проверка показала, что условие не выполняется, т.к. Fрасч<Fтаб, (Fтаб.=6,39 >Fрасч=3,50), т.е.D(Ei) возрастает и не постоянна с вероятностью 95%.
cov(Ej Ei)=0. Расчёты показали присутствие автокорреляции dрасч = 3,41, но так как r1расч=-0,79 < r1таб.=0,36, то гипотеза может быть принята.
Еотн=0,23 % < 15%, т.е. модель построена на высоком уровне точности.
Вывод по показательной модели:
Линейная зависимость имеет вид:
Y= 1,41+0,01*X
Показатели качества подгонки свидетельствуют о соответствии расчетных значений фактическим, т.к. дисперсия σ2=0,0038554 (чем меньше остаточная дисперсия, тем лучше регрессионное уравнении).
Коэффициент детерминации R2=0,93, т.к. он близок к 1, то выше качество подгонки. Это говорит о соответствии регрессионного уравнения реальным данным (т.к. R2→1).
Индекс корреляции rxy=0,96, т.к. он близок к 1, то это говорит о сильной связи между переменными.
Коэффициент эластичности Эху = 0,25, что показывает, на сколько процентов изменится результативный признак (Y), при изменении факторного (X) на 1 %.
Бета-коэффициент = 0,96 показывает, на какую часть величины изменится в среднем значение результативного признака Y, при изменении факторного признака X на величину его среднего квадратического отклонения. Sy = 0,21 и Sx = 20,20.
В ходе выполнения работы были выдвинуты следующие гипотезы:
Об отсутствии линейной связи в результате определения значений F-статистики и сравнениями его с табличными значениями. Данная гипотеза была отвергнута с вероятностью 95%, Fтаб.=5,32 <Fрасч.=108,25, т.е. линейная связь существует.
Гипотеза о несущественном влиянии х на у. После сравнения рассчитанного значения t-статистики и tтаб. Данная гипотеза была отвергнута с вероятностью 95%, так как значимость коэффициента уравнения регресссии (t-критерий Стьюдента) равно 10,40, что говорит о том, что Х влияет на У существенно.
При проверке «хороших» свойств оценки коэффициентов регрессии были выдвинуты следующие гипотезы:
М(Еi)=0 принимается, т.к. tрасч<tтаб (если tрасч.=10,40 > tтаб =2,26, то гипотеза отклоняется с заданной вероятностью.) с вероятностью 95%.
D=const. Проверка показала, что условие не выполняется, т.к. Fрасч<Fтаб, (Fтаб.=6,39 >Fрасч=4,77), т.е.D(Ei) возрастает и не постоянна с вероятностью 95%.
cov(Ej Ei)=0. Расчёты показали, что данная модель не коррелируема dрасч = 1,48, но так как r1расч=0,26 < r1таб.=0,36, то гипотеза может быть принята.
Еотн=2,55 % < 15%, т.е. модель построена на высоком уровне точности.
Вывод по гиперболической модели:
Линейная зависимость имеет вид:
Y= 137,74 - 1950,11*X
Показатели качества подгонки свидетельствуют о соответствии расчетных значений фактическим, т.к. дисперсия σ2=350,15 (чем меньше остаточная дисперсия, тем лучше регрессионное уравнении).
Коэффициент детерминации R2=0,78, т.к. он близок к 1, то выше качество подгонки. Это говорит о соответствии регрессионного уравнения реальным данным (т.к. R2→1).
Индекс корреляции rxy=-0,88, то это говорит о сильной обратной связи между переменными.
Коэффициент эластичности Эху = -0,64, что показывает, на сколько процентов изменится результативный признак (Y), при изменении факторного (X) на 1 %.
Бета-коэффициент = -0,88 показывает, на какую часть величины изменится в среднем значение результативного признака Y, при изменении факторного признака X на величину его среднего квадратического отклонения. Sy = 35,43 и Sx = 0,02.
В ходе выполнения работы были выдвинуты следующие гипотезы:
Об отсутствии линейной связи в результате определения значений F-статистики и сравнениями его с табличными значениями. Данная гипотеза была отвергнута с вероятностью 95%, Fтаб.=5,32 <Fрасч.=27,84, т.е. линейная связь существует.
Гипотеза о несущественном влиянии х на у. После сравнения рассчитанного значения t-статистики и tтаб. Данная гипотеза была отвергнута с вероятностью 95%, так как значимость коэффициента уравнения регресссии (t-критерий Стьюдента) равно -5,28, что говорит о том, что Х влияет на У не существенно.
При проверке «хороших» свойств оценки коэффициентов регрессии были выдвинуты следующие гипотезы:
М(Еi)=0 принимается, т.к. tрасч<tтаб (если tрасч.=1,93 > tтаб =2,26, то гипотеза отклоняется с заданной вероятностью.) с вероятностью 95%.
D=const. Проверка показала, что условие не выполняется, т.к. Fрасч<Fтаб, (Fтаб.=6,39 >Fрасч=2,68), т.е.D(Ei) возрастает и не постоянна с вероятностью 95%.
cov(Ej Ei)=0. Расчёты показали присутствие положительной корреляции dрасч = 1,92, но так как r1расч=-0,14 < r1таб.=0,36, то гипотеза может быть принята.
Еотн=23,10 % > 15%, т.е. модель построена не на высоком уровне точности.
После сравнения характеристик линейной, степенной, показательной, гиперболической модели, сделан вывод, что лучшей моделью является степенная:
Y.= 2,20*Х0,95+Е
(у=0,34+0,95*Х – в линейном виде).
Прогнозировaние осуществляется путем подстановки в регрессионное уравнение прогнозного знaчения aргумента. Т.е. прогнозное значение Y опредeляется слeдующим образом:
Yпрогн.=f(Xпрогн.)
46,7*110%=51,37
(для степенной модели)
=1,71
92,81
=
=1,96
Доверительный интервал:
где
;
.
Делaем прогноз для линeйной модели построeнной для степенной.
tтаб.=
=
2,31,
0,05 тогда
0,12
Приложение А
Приложение Б
Таблица 1 - линeйная модель с интервальным прогнозом.
|
lgY=y |
lgX=x |
Ŷ |
точечный прогноз |
нижная граница прогноза |
верхная граница прогноза |
1 |
2,16 |
1,87 |
2,11 |
|
|
|
2 |
1,58 |
1,36 |
1,63 |
|
|
|
3 |
1,48 |
1,18 |
1,46 |
|
|
|
4 |
2,10 |
1,89 |
2,14 |
|
|
|
5 |
1,81 |
1,49 |
1,76 |
|
|
|
6 |
1,88 |
1,66 |
1,92 |
|
|
|
7 |
2,00 |
1,72 |
1,98 |
|
|
|
8 |
1,76 |
1,49 |
1,76 |
|
|
|
9 |
2,03 |
1,77 |
2,02 |
|
|
|
10 |
2,00 |
1,76 |
2,01 |
|
|
|
Прогноз |
|
1,71 |
|
1,96 |
1,84 |
2,08 |
Таблица 2 - степенная модель с интервальным прогнозом
|
Y |
X |
Ŷ |
точечный прогноз |
нижная граница прогноза |
верхная граница прогноза |
1 |
143 |
74 |
2,11 |
|
|
|
2 |
38 |
23 |
1,63 |
|
|
|
3 |
30 |
15 |
1,46 |
|
|
|
4 |
127 |
78 |
2,14 |
|
|
|
5 |
64 |
31 |
1,76 |
|
|
|
6 |
75 |
46 |
1,92 |
|
|
|
7 |
99 |
53 |
1,98 |
|
|
|
8 |
57 |
31 |
1,76 |
|
|
|
9 |
107 |
59 |
2,02 |
|
|
|
10 |
99 |
57 |
2,01 |
|
|
|
Прогноз |
|
51,37 |
|
92,81 |
69,18 |
120,23 |
Задание №2.
Необходимо: собрать данные (экономические показатели), должно быть не менее 15 наблюдений зависимой переменной Y и независимых переменных X1, X2, X3.
Требуется:
С помощью корреляционного анализа осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.
Рассчитать параметры модели.
Для характеристики модели определить:
линейный коэффициент множественной корреляции,
коэффициент детерминации,
средние коэффициенты эластичности,
бета-, дельта – коэффициенты.
Дать их интерпретацию.