
3. Экспериментальная часть
Построим нелинейную модель, используя данные из лабораторной работы №1.
Сначала выберем нелинейное соотношение, которое возможно более лучшим способом аппроксимирует данную зависимость между совокупными личными расходами и личными располагаемыми доходами. Выбор рекомендуется произвести по таблице «Виды форм распределения» (приложение 1), сравнивая различные виды распределений с диаграммой рассеяния для имеющихся данных (см. лабораторную работу №1). Кроме того, можно использовать априорную информацию, так, например, соотношения между спросом на определенный товар и общей суммой дохода, как уже отмечалось ранее, описываются кривыми Энгеля:
(3.1)
Оценим коэффициенты и в уравнении (3.1), предварительно приведя его к линейному виду путем логарифмирования обеих частей:
(3.2)
С учетом замен:
уравнение можно представить в следующем
виде:
y’ = a’+ bz (3.3)
Процедура оценивания регрессии теперь будет следующей. Сначала вычислим у' и z для каждого наблюдения путем взятия логарифмов от исходных значений. Затем оценим регрессионную зависимость значений у' от z методом наименьших квадратов (лабораторная работа №2). Необходимые расчеты предоставлены в таблице 3.1.
Таблица 3.1
№ п/п |
x |
y |
z=ln x |
y'=log y |
|
e' |
e' 2 |
1 |
479,7 |
440,4 |
6,1731609 |
6,0876834 |
437,61345 |
2,7865484 |
7,7648518 |
2 |
489,7 |
452 |
6,193793 |
6,1136822 |
446,63509 |
5,3649077 |
28,782234 |
3 |
503,8 |
461,4 |
6,2221794 |
6,1342653 |
459,35218 |
2,0478153 |
4,1935473 |
4 |
524,9 |
482 |
6,2632078 |
6,1779441 |
478,37547 |
3,6245256 |
13,137186 |
5 |
542,3 |
500,5 |
6,2958194 |
6,2156076 |
494,05661 |
6,4433939 |
41,517326 |
6 |
580,8 |
528 |
6,3644065 |
6,2690963 |
528,73401 |
-0,7340117 |
0,5387732 |
7 |
616,3 |
557,5 |
6,4237339 |
6,3234625 |
560,68691 |
-3,1869103 |
10,156398 |
8 |
646,8 |
585,7 |
6,4720371 |
6,3728077 |
588,12324 |
-2,4232431 |
5,8721072 |
9 |
673,5 |
602,7 |
6,512488 |
6,4014196 |
612,12961 |
-9,429615 |
88,917639 |
10 |
701,3 |
634,4 |
6,5529358 |
6,4526797 |
637,11393 |
-2,7139348 |
7,3654422 |
11 |
722,5 |
657,9 |
6,5827174 |
6,4890529 |
656,15941 |
1,7405928 |
3,0296632 |
12 |
751,6 |
672,1 |
6,6222043 |
6,5104071 |
682,29208 |
-10,192076 |
103,87841 |
13 |
779,2 |
696,8 |
6,6582678 |
6,5464984 |
707,06745 |
-10,267446 |
105,42044 |
14 |
810,3 |
737,1 |
6,6974045 |
6,6027236 |
734,97311 |
2,1268884 |
4,5236544 |
15 |
865,3 |
768,5 |
6,7630763 |
6,6444406 |
784,29551 |
-15,795507 |
249,49803 |
16 |
858,4 |
763,6 |
6,7550702 |
6,6380441 |
778,10972 |
-14,509719 |
210,53195 |
17 |
875,8 |
780,2 |
6,7751378 |
6,6595503 |
793,70763 |
-13,507626 |
182,45595 |
18 |
906,8 |
823,1 |
6,8099219 |
6,7130777 |
821,48863 |
1,6113729 |
2,5965226 |
19 |
942,9 |
864,3 |
6,8489602 |
6,7619199 |
853,82696 |
10,473043 |
109,68463 |
20 |
988,8 |
903,2 |
6,8964921 |
6,805944 |
894,92458 |
8,2754156 |
68,482504 |
21 |
1015,5 |
927,6 |
6,9231364 |
6,8326006 |
918,82137 |
8,7786347 |
77,064427 |
22 |
1021,6 |
931,8 |
6,9291253 |
6,8371182 |
924,27996 |
7,5200434 |
56,551053 |
23 |
1049,3 |
950,9 |
6,9558786 |
6,8574089 |
949,06287 |
1,8371323 |
3,3750552 |
24 |
1058,3 |
963,3 |
6,9644191 |
6,8703649 |
957,11352 |
6,1864755 |
38,272479 |
25 |
1095,4 |
1009,2 |
6,9988749 |
6,9169132 |
990,29227 |
18,907731 |
357,50229 |
Сумма |
19500,8 |
17694,2 |
165,65445 |
163,23471 |
17689,236 |
4,9644327 |
1781,1126 |
Среднее |
780,032 |
707,768 |
6,6261779 |
6,5293885 |
707,56942 |
0,1985773 |
71,244502 |
Коэффициент при z будет представлять собой непосредственно оценку коэффициента . Постоянный член является оценкой ', т.е. log. Таким образом, оценка b коэффициента равна 0,9890, а для того чтобы найти оценку a коэффициента , найдем экспоненту значения a’ = -0,02412: a = exp(a’) = 0,9761.
Следовательно, нелинейная, а точнее экспоненциальная зависимость будет иметь следующий вид:
(3.4)
Рассчитаем коэффициент детерминации R2, используя дисперсии значений y и остатков e’:
(3.5)
Как видно из (3.5), коэффициент детерминации позволяет говорить о достаточно хорошем соответствии, обеспечиваемом уравнением регрессии (3.4).
Эластичность y по x в данном уравнении равна b=0,989, т.е. эластичность совокупных личных расходов по располагаемому доходу равна 0,989, что означает: изменение дохода на 1% вызывает изменение совокупных расходов на 0,989%.
Проверим тест Кокса-Бокса для того, чтобы непосредственно сравнить суммы квадратов отклонений в линейной и логарифмической моделях.
Вычисляем среднее геометрическое значение y, используя среднее арифметическое значений y’=log y:
(3.6)
Пересчитываем наблюдения y и log y по формулам:
,
(3.7)
Таблица 3.2
№ п/п |
x |
y |
y* |
y*расч. |
eлин. |
e2лин. |
1 |
479,7 |
440,4 |
0,6429392 |
0,6514525 |
-0,0085133 |
0,0000725 |
2 |
489,7 |
452 |
0,659874 |
0,6641657 |
-0,0042916 |
0,0000184 |
3 |
503,8 |
461,4 |
0,6735971 |
0,6820912 |
-0,0084941 |
0,0000721 |
4 |
524,9 |
482 |
0,703671 |
0,708916 |
-0,005245 |
0,0000275 |
5 |
542,3 |
500,5 |
0,7306791 |
0,7310369 |
-0,0003578 |
0,0000001 |
6 |
580,8 |
528 |
0,7708263 |
0,7799825 |
-0,0091562 |
0,0000838 |
7 |
616,3 |
557,5 |
0,8138933 |
0,8251142 |
-0,0112209 |
0,0001259 |
8 |
646,8 |
585,7 |
0,8550624 |
0,8638894 |
-0,0088269 |
0,0000779 |
9 |
673,5 |
602,7 |
0,8798807 |
0,8978335 |
-0,0179528 |
0,0003223 |
10 |
701,3 |
634,4 |
0,9261595 |
0,9331761 |
-0,0070166 |
0,0000492 |
11 |
722,5 |
657,9 |
0,9604671 |
0,960128 |
0,0003391 |
0,0000001 |
12 |
751,6 |
672,1 |
0,9811976 |
0,9971232 |
-0,0159256 |
0,0002536 |
13 |
779,2 |
696,8 |
1,0172571 |
1,0322116 |
-0,0149544 |
0,0002236 |
14 |
810,3 |
737,1 |
1,076091 |
1,0717495 |
0,0043416 |
0,0000188 |
15 |
865,3 |
768,5 |
1,1219318 |
1,1416718 |
-0,01974 |
0,0003897 |
16 |
858,4 |
763,6 |
1,1147783 |
1,1328998 |
-0,0181214 |
0,0003284 |
17 |
875,8 |
780,2 |
1,1390126 |
1,1550207 |
-0,016008 |
0,0002563 |
18 |
906,8 |
823,1 |
1,2016423 |
1,1944314 |
0,0072108 |
0,000052 |
19 |
942,9 |
864,3 |
1,2617901 |
1,2403259 |
0,0214642 |
0,0004607 |
20 |
988,8 |
903,2 |
1,3185801 |
1,2986793 |
0,0199008 |
0,000396 |
21 |
1015,5 |
927,6 |
1,3542016 |
1,3326235 |
0,0215782 |
0,0004656 |
22 |
1021,6 |
931,8 |
1,3603332 |
1,3403785 |
0,0199547 |
0,0003982 |
23 |
1049,3 |
950,9 |
1,3882173 |
1,3755939 |
0,0126234 |
0,0001593 |
24 |
1058,3 |
963,3 |
1,40632 |
1,3870358 |
0,0192842 |
0,0003719 |
25 |
1095,4 |
1009,2 |
1,4733293 |
1,4342016 |
0,0391278 |
0,001531 |
Cумма |
19500,8 |
17694,2 |
25,831732 |
25,831732 |
0 |
0,0061552 |
Ср-е |
780,032 |
707,768 |
1,0332693 |
1,0332693 |
0 |
0,0002462 |
Оценим регрессии для линейной модели между значениями xi и y i* (табл. 3.2) с использованием y * вместо y в качестве зависимой переменной и для логарифмической - между значениями z = log x и log yi* (табл. 3.3) с использованием log y * вместо log y. Используем формулы для нахождения оценок коэффициентов обеих регрессий через ковариацию, дисперсию независимой переменной и математические ожидания (см. лабораторную работу №2), а затем высчитаем коэффициенты детерминации и суммы квадратов отклонений (СКО) для каждой регрессии и сравним их (табл.4).
Таблица 3.3
№ п/п |
x |
z=log x |
|
|
eлогар. |
e2логар. |
1 |
479,7 |
6,1731609 |
-0,4417051 |
-0,3815471 |
-0,060158 |
0,003619 |
2 |
489,7 |
6,193793 |
-0,4157063 |
-0,3688429 |
-0,0468634 |
0,0021962 |
3 |
503,8 |
6,2221794 |
-0,3951232 |
-0,3509301 |
-0,0441931 |
0,001953 |
4 |
524,9 |
6,2632078 |
-0,3514444 |
-0,3241242 |
-0,0273202 |
0,0007464 |
5 |
542,3 |
6,2958194 |
-0,3137809 |
-0,302019 |
-0,0117619 |
0,0001383 |
6 |
580,8 |
6,3644065 |
-0,2602922 |
-0,2531079 |
-0,0071843 |
0,0000516 |
7 |
616,3 |
6,4237339 |
-0,205926 |
-0,2080081 |
0,002082 |
0,0000043 |
8 |
646,8 |
6,4720371 |
-0,1565808 |
-0,1692603 |
0,0126795 |
0,0001608 |
9 |
673,5 |
6,512488 |
-0,127969 |
-0,1353402 |
0,0073712 |
0,0000543 |
10 |
701,3 |
6,5529358 |
-0,0767088 |
-0,1000225 |
0,0233137 |
0,0005435 |
11 |
722,5 |
6,5827174 |
-0,0403356 |
-0,0730897 |
0,0327541 |
0,0010728 |
12 |
751,6 |
6,6222043 |
-0,0189814 |
-0,0361205 |
0,0171391 |
0,0002938 |
13 |
779,2 |
6,6582678 |
0,0171099 |
-0,001057 |
0,0181669 |
0,00033 |
14 |
810,3 |
6,6974045 |
0,0733351 |
0,038453 |
0,034882 |
0,0012168 |
15 |
865,3 |
6,7630763 |
0,115052 |
0,108326 |
0,0067261 |
0,0000452 |
16 |
858,4 |
6,7550702 |
0,1086556 |
0,0995601 |
0,0090955 |
0,0000827 |
17 |
875,8 |
6,7751378 |
0,1301618 |
0,1216654 |
0,0084964 |
0,0000722 |
18 |
906,8 |
6,8099219 |
0,1836892 |
0,1610483 |
0,0226409 |
0,0005126 |
19 |
942,9 |
6,8489602 |
0,2325314 |
0,2069104 |
0,025621 |
0,0006564 |
20 |
988,8 |
6,8964921 |
0,2765555 |
0,2652226 |
0,0113329 |
0,0001284 |
21 |
1015,5 |
6,9231364 |
0,3032121 |
0,2991427 |
0,0040693 |
0,0000166 |
22 |
1021,6 |
6,9291253 |
0,3077297 |
0,3068923 |
0,0008374 |
0,0000007 |
23 |
1049,3 |
6,9558786 |
0,3280204 |
0,3420829 |
-0,0140625 |
0,0001978 |
24 |
1058,3 |
6,9644191 |
0,3409764 |
0,3535166 |
-0,0125403 |
0,0001573 |
25 |
1095,4 |
6,9988749 |
0,3875247 |
0,4006491 |
-0,0131244 |
0,0001723 |
Cумма |
19500,8 |
165,65445 |
0 |
0 |
0 |
0,014423 |
Ср-е |
780,032 |
6,6261779 |
0 |
0 |
0 |
0,0005769 |
Таблица 3.4
Значения параметров |
Регрессия |
|
линейная |
логарифмич. |
|
Дисперсия (Var) |
0,069652 |
0,069898 |
Ковариация(Cov) |
50,38646 |
50,35088 |
Коффициент b |
0,001271 |
0,00127 |
Коффициент a |
0,041602 |
-0,99097 |
Коффициент детерминации R2 |
0,996318 |
0,991402 |
СКО (S) |
0,006155 |
0,014423 |
Из таблицы 3.4 видно, что линейная регрессия дает немного более точное соответствие, чем логарифмическая, так как коэффициент детерминации R2 для линейной регрессии больше, а сумма квадратов отклонений меньше, чем для логарифмической регрессии.
Проверим, не обеспечивает ли линейная модель значимо лучшего соответствия. Вычислим величину 2расч по формуле (2.18) и возьмем ее абсолютное значение. Эта статистика имеет распределение 2 с одной степенью свободы. Если она превышает критическое значение 2крит с одной степенью свободы при выбранном уровне значимости, то делается вывод о наличии значимой разницы в качестве оценивания (см. табл. 3.5).
Таблица 3.5
Уровень значимости |
5% |
1% |
0,10% |
2крит |
3,8415 |
6,6349 |
10,828 |
Таким образом, расчетное значение равно:
2расч==
=
(3.8)
Следовательно, с уровнями значимости 5% и 1% можно сделать вывод о том, что разница в качестве оценивания значима, и для отражения зависимости между общими совокупными расходами и располагаемым доходом в данном случае предпочтительнее строить линейную модель.