- •Институт «высшие столыпинские курсы» государственного права и управления
- •Пояснительная записка
- •Студенты также должны иметь представление:
- •Учебно-тематический план по курсу: «Эконометрика»
- •Программа курса
- •Методические указания к решению задач по разделу 1.
- •3. Коэффициент корреляции
- •Решение
- •Контрольная работа по разделу 1.
- •Методические указания к решению задач по разделу 2.
- •Задача 4.
- •Методические указания к решению задач по разделу 3.
- •Коэффициент ранговой корреляции Спирмена.
- •Коэффициент "" Кендалла
- •Анализ двухвходовых таблиц ""
- •Фи-коэффициент
- •Коэффициент сопряженности признаков
- •V – коэффициент Крамера.
- •Коэффициент взаимной сопряженности Чупрова
- •Контрольная работа по разделу 3.
- •Анализ сезонных колебаний
- •Контрольные вопросы для самопроверки по разделу 4.
- •Контрольная работа по разделу 4.
- •Список рекомендуемой литературы
- •I Список рекомендуемой литературы.
Решение
1)
-уравнение регрессии.
=2000-40(90/40)2=1797,5
220,9-19,1+67,3-05+202,5=66,6
ЕSS=1797,5-66,6=1797,5-66,6=1730,9
Очень маленькое значение, объем продаж лишь на 3,7% объясняется температурой. Значит, сумма средств, потраченных на лекарство, слабо зависит от температуры.
2)
Задача 3. По совокупности 30 предприятий торговли изучается зависимость между признаками: – цена за товар А, тыс. руб.;– прибыль торгового предприятия, млн. руб. При оценке линейной регрессионной модели были получены следующие промежуточные результаты.
Поясните, какой показатель корреляции можно определить по этим данным.
Для вычислений будем использовать следующие формулы:
- общая сумма квадратов отклонений, TSS;
- сумма квадратов отклонений, обусловленная регрессией, RSS;
- остаточная сумма квадратов отклонений, ESS.
Решение. По указанным данным можно определить индекс корреляции для нелинейной регрессии:
Так же можно найти R2:
= 1-=0,675
Не очень большой R2 свидетельствует о не очень сильной линейной связи. В то же время был подсчитан коэффициент не линейной связи (0,822), который свидетельствует о достаточно существенной зависимости.
Задача 4: Нахождение параметров регрессии на примере линейной функции.
По семи территориям Уральского региона за 2002 год известны значения двух признаков:
- расходы на покупку продовольственных товаров в общих расходах, %;
- среднедневная заработная плата одного работающего, руб.
Номер |
Регион |
|
|
1 |
Удмуртская респ. |
68,8 |
45,1 |
2 |
Свердловская обл. |
61,2 |
59 |
3 |
Башкортостан |
59,9 |
57,2 |
4 |
Челябинская обл. |
56,7 |
61,8 |
5 |
Пермская обл. |
55 |
58,8 |
6 |
Курганская обл. |
54,3 |
47,2 |
7 |
Оренбургская обл. |
49,3 |
55,2 |
Задание.
1. Для характеристики зависимости от рассчитать параметры следующих функций: 1.1) линейной; 1.2) степенной;
2. Оценить каждую модель через коэффициент детерминации R2. Решение.
Линейная регрессия = а + b
Для определения параметров а и b линейной регрессии по исходным данным рассчитываем
следующие величины:
Результаты промежуточных вычислений приведены в таблице.
таблица 2.1.
|
|
|
|
|
|
- | |
1 |
68,8 |
45,1 |
3102,88 |
2034,01 |
4733,44 |
61,33 |
7,5 |
2 |
61,2 |
59 |
3610,8 |
3481 |
3745,44 |
56,54 |
4,7 |
3 |
59,9 |
57,2 |
3426,28 |
3271,84 |
3588,01 |
57,16 |
2,8 |
4 |
56,7 |
61,8 |
3504,06 |
3819,24 |
3214,89 |
55,57 |
1,2 |
5 |
55 |
58,8 |
3234 |
3457,44 |
3025 |
56,61 |
-1,5 |
6 |
54,3 |
47,2 |
2562,96 |
2227,84 |
2948,49 |
60,61 |
-6,2 |
7 |
49,3 |
55,2 |
2721,36 |
3047,04 |
2430,49 |
57,85 |
-8,5 |
Итого |
405,2 |
384,3 |
22162,3 |
21338,4 |
23685,8 |
-55,58 |
0,0 |
Среднее значение |
57,88 |
54,9 |
3166,05 |
3048,34 |
3383,68 |
|
|
Σ |
5,74 |
5,86 |
|
|
|
|
|
σ2 |
32,92 |
34,34 |
|
|
|
|
|
Уравнение регрессии: = 76,88-0,35.
С увеличением среднедневной заработной платы на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,35 %-ых пункта. Для определения направления и тесноты связи рассчитаем линейный коэффициент парной корреляции:
Связь умеренная, обратная.
Определим коэффициент детерминации:
можно рассчитать по формуле R2 = (-0,357)2 = 0,127.
получить в рамках оценивания параметров регрессии на компьютере.
Вариация результата на 12,7 % объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения , определим теоретические (расчётные) значения.
Степенная функция.
Проведём процедуру линеаризации путём логарифмирования обеих частей уравнения: lg = lga + b * lg
После переобозначения мы будем оценивать регрессию вида: = с + d
|
|
|
|
|
|
- |
(-)2 | |
1 |
1,8376 |
1,6542 |
3,0397 |
2,7363 |
3,3767 |
61,0 |
7,8 |
61,29 |
2 |
1,7868 |
1,7709 |
3,1641 |
3,1359 |
3,1925 |
56,3 |
4,9 |
24,21 |
3 |
1,7774 |
1,7574 |
3,1236 |
3,0884 |
3,1592 |
56,8 |
3,1 |
9,60 |
4 |
1,7536 |
1,7910 |
3,1406 |
3,2076 |
3,0751 |
55,5 |
1,2 |
1,42 |
5 |
1,7404 |
1,7694 |
3,0794 |
3,1307 |
3,0289 |
56,3 |
-1,3 |
1,79 |
6 |
1,7348 |
1,6739 |
2,9040 |
2,8021 |
3,0095 |
60,1 |
-5,8 |
34,22 |
7 |
1,6928 |
1,7419 |
2,9488 |
3,0344 |
2,8657 |
57,4 |
-8,1 |
65,73 |
Итого |
12,3234 |
12,1587 |
21,4002 |
21,1354 |
21,7076 |
403,5 |
1,7 |
198,26 |
Среднее значение |
1,7626 |
1,7396 |
3,0572 |
3,0193 |
3,1011 |
|
|
28,27 |
Σ |
0,0425 |
0,0484 |
|
|
|
|
|
|
σ2 |
0,0018 |
0,0012 |
|
|
|
|
|
|
Рассчитаем С (или lg a) и b:
Получим линейное уравнение: Y= 2,278 – 0,298 X
Выполнив его потенцирование, получим:
= 102,278*-0,298 = 189,7-0,298
Подставляя в данное уравнение фактические значения , получаем теоретические значения результата .
Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
Определение: Доверительный интервал – это интервал, накрывающий истинное значение (которое мы не знаем, но строим его оценку, т.е. приблизительное значение) параметра с заданной вероятностью α.
Задача 5. Построить доверительный интервал для истинных значений регрессии при всех наблюдениях( i =1:14).
Решение: Доверительный интервал для одного истинного значения регрессии при заданном уровне значимости будет следующим:
- , где -квантиль распределения Стьюдента приf степенях свободы и заданном уровне значимости α. - дисперсия оценки истинного значения. Она рассчитывается следующим образом:.
Пусть известно, что T=14, =2,0809,Находим квантиль распределения Стьюдентапри α=0,05 иf = 14-1-1=12 степенях свободы. Для этого в Excel в ячейку надо ввести строчку: {==СТЬЮДРАСПОБР(0,05;12)}и нажать Ввод. Он равен 2,179. Пусть с помощью МНК найдены оценки коэффициентов регрессии =7,0356 + 0,5435.
Представим расчеты в таблице. Значенияинам даны. Остальные столбцы рассчитываются.
№ |
|
|
|
|
|
|
- |
|
1 |
20 |
32 |
24,4276 |
388,4841 |
0,9692 |
2,1119 |
22,3157 |
26,53 |
2 |
24 |
30 |
23,3406 |
471,3241 |
1,0360 |
2,2575 |
21,0831 |
25,59 |
3 |
28 |
36 |
26,6016 |
246,8041 |
0,8428 |
1,8364 |
24,7652 |
28,13 |
4 |
30 |
40 |
28,7756 |
137,1241 |
0,7299 |
1,5905 |
27,1850 |
30,36 |
5 |
31 |
41 |
29,3186 |
114,7041 |
0,7047 |
1,5356 |
27,7830 |
30,85 |
6 |
33 |
47 |
32,5806 |
22,1841 |
0,5890 |
1,2835 |
31,2971 |
32,86 |
7 |
34 |
56 |
37,4716 |
5,2441 |
0,5838 |
1,722 |
26,1994 |
38,74 |
8 |
37 |
54 |
36,3846 |
18,4041 |
0,5653 |
1,2318 |
35,1252 |
37,61 |
9 |
38 |
60 |
39,6456 |
68,7241 |
0,6498 |
1,4159 |
38,2297 |
41,06 |
10 |
40 |
55 |
36,9276 |
10,8241 |
0,5732 |
1,2491 |
35,6785 |
38,17 |
11 |
41 |
61 |
40,1896 |
86,3041 |
0,6713 |
1,4628 |
38,7268 |
41,65 |
12 |
43 |
67 |
43,4496 |
233,7841 |
0,8302 |
1,8089 |
41,6407 |
45,25 |
13 |
45 |
69 |
44,5376 |
298,9441 |
0,8914 |
1,9424 |
42,5952 |
46,48 |
В столбцах 8 и 9 (предпоследний и последний) указаны соответственно нижние и верхние доверительные границы. Например, при =32 истинное значение регрессии генеральной совокупности с доверительной вероятностью 0,95 будет находиться в интервале 22,3157≤≤26,53
Доверительные интервалы для параметров линейной регрессии вычисляются по формуле:
, где - оценка стандартного отклонения.А- это оценка параметра регрессии, т.е. либоа , либо b. Определим доверительные границы для параметров регрессии генеральной совокупности. Точечные оценки параметров: а=7,0356 , b = 0,5435. Стандартные ошибки оценок параметров регрессии = 2,1532, а=2,179 . Зададимся уровнем значимости α=0,05.. В соответствии с выше приведенной формулой получаем следующие доверительные границы для:а:7,0356 ±2,179 * 2,132 , или, 7,0356 ±4,6918.
b: 0,5435±0,0876.
Задачи для самоконтроля.
Задача 6. n = 52;
Построить и оценить модель линейной регрессии: = а + b. Для этого найти:
1) â -? - ? TSS-? ESS-? R2-? Y(-3)-?
Задача 7. Известно, что:
|
2 |
4 |
-3 |
2 |
5 |
-6 |
2 |
4 |
7 |
|
3 |
2 |
-1 |
3 |
0 |
-4 |
2 |
5 |
6 |
Построить регрессию на , т.е. оценить коэффициенты регрессии
=+.
Найти:; TSS, ESS, RSS, R2,
Задача 8. Пусть Х1, Х2, …Хn – независимые, одинаково распределенные случайные величины.
Приведено 4 оценки для математического ожидания xi:
y1=x1
y2=0,2*x1+0,8*x2
y3=x1+x2-x3
y4=½x1+⅓x2+¼x3
E[xi]=μ ; Var[xi]=V[xi]
Какие из указанных оценок являются несмещенными?
Какая оценка среди несмещенных является наиболее эффективной?
Примечание: Несмещенной называется оценка, математическое ожидание которой равно истинному значению, то есть . Эффективной называется оценка, обладающая наименьшей дисперсией. Дисперсия а рассчитывается по формуле:,a