Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы оптимальных решений.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
924.67 Кб
Скачать

Задача 6

Имеются данные по 8 субъектам Российской Федерации за январь-март 2007 года о денежных доходах и потребительских расходах на душу населения в среднем за месяц, которые приведены в таблице:

Номер субъекта РФ

1

2

3

4

5

6

7

8

Денежные доходы, тыс.руб.

1,98

1,75

1,59

1,58

1,86

2,35

1,28

1,5

Потребительские расходы, тыс.руб.

1,4

0,82

1,26

1,18

1,52

1,23

0,93

1,1

Для необходимых промежуточных расчетов предлагается воспользоваться следующей таблицей:

Номер субъекта РФ

1

2

3

4

5

6

7

8

сумма

x

1,98

1,75

1,59

1,58

1,86

2,35

1,28

1,5

1,98

y

1,4

0,82

1,26

1,18

1,52

1,23

0,93

1,1

1,4

квадрат х

3,9204

3,0625

2,5281

2,4964

3,4596

5,5225

1,6384

2,25

24,8779

произведение ху

2,772

1,435

2,0034

1,8644

2,8272

2,8905

1,1904

1,65

16,6329

квадрат у

1,96

0,6724

1,5876

1,3924

2,3104

1,5129

0,8649

1,21

11,5106

Квантиль распределения Стьюдента при уровне значимости 0,1 равняется 1,943.

На основе имеющихся данных требуется:

1. Построить поле рассеяния наблюдаемых значений показателей и на основе его визуального наблюдения выдвинуть гипотезу о виде статистической зависимости потребительских расходов у от денежных доходов х; записать эту гипотезу в виде математической модели.

2. Используя метод наименьших квадратов найти точечные оценки неизвестных параметров модели, записать найденное уравнение регрессии и построить график функции регрессии.

3. Найти коэффициент парной корреляции между денежными доходами и потребительскими расходами; проверить его значимость.

4. Найти точечный и интервальный прогноз среднемесячных потребительских расходов в 8-ом субъекте РФ при уровне значимости 0,1 предполагая, что среднемесячные денежные доходы в этом субъекте увеличится на 30%.

5. Привести содержательную интерпретацию полученных результатов.

Решение.

6.1. Полем рассеяния называется множество точек на плоскости, координаты которых соответствуют наблюдаемым значениям исследуемых показателей. В нашем примере хi – среднедушевые денежные доходы, yi – среднедушевые потребительские расходы в i-м субъекте РФ, i = 1,…,8. Таким образом, поле рассеяния состоит из 8-и точек с координатами (xi,yi), которые показаны на рис.

Визуальный анализ поля рассеяния позволяет выдвинуть гипотезу о линейной зависимости потребительских расходов у от денежных доходов х и записать эту зависимость в виде линейной модели у = α + βх + u, где α, β - неизвестные постоянные коэффициенты, а u – случайная величина, характеризующая отклонения реальных значений потребительских расходов от их теоретических значений α + βх. Случайная величина u называется случайным отклонением или случайным возмущением модели. Ее включение в модель призвано отразить:

а) влияние не учтенных в модели факторов, влияющих на размер потребительских расходов;

б) элемент случайности и непредсказуемости человеческих реакций;

в) ошибки наблюдений и измерений.

6.2. После формулировки математической модели основная задача состоит в получении оценок неизвестных параметров α и β по результатам наблюдений над переменными х и у, т.е. задача состоит в получении так называемого уравнения регрессии

у = a + bх, являющегося некоторой реализацией модели, в котором коэффициенты а и b есть оценки неизвестных параметров α и β соответственно. Решение задачи нахождения оценок а и b основывается на применении метода наименьших квадратов (сокращенно - МНК), суть которой в следующем.

Оценки а и b можно искать по следующим формулам:

nΣxiyi – ΣxiΣyi

b = ——————— , а = уср - bхср. (2)

nΣxi2 – (Σxi)2

Для удобства вычисления оценок искомых коэффициентов модели составляется табл.1, в которой столбцы «у», «у - у», «(у - у)2» заполняются после нахождения уравнения регрессии.

Табл.1

Номер субъекта РФ

х

у

х2

ху

у2

ŷ

ŷ-у

(ŷ-у)2

1

1,98

1,11

3,9204

2,1978

1,2321

1,258339

0,148339

0,022004

2

1,75

0,87

3,0625

1,5225

0,7569

1,11526

0,24526

0,060153

3

1,59

1

2,5281

1,59

1

1,015728

0,015728

0,000247

4

1,58

1,16

2,4964

1,8328

1,3456

1,009507

-0,15049

0,022648

5

1,86

1,51

3,4596

2,8086

2,2801

1,183689

-0,32631

0,106479

6

2,35

1,19

5,5225

2,7965

1,4161

1,488508

0,298508

0,089107

7

1,28

0,92

1,6384

1,1776

0,8464

0,822883

-0,09712

0,009432

8

1,5

1,28

2,25

1,92

1,6384

0,95974

-0,32026

0,102566

cymm

13,89

9,04

24,8779

15,8458

10,5156

8,853654

-0,18635

0,412636

Воспользуемся формулами (2) и значениями последней строки табл.1 для нахождения оценок а и b. Тогда

хср = Σхi/8 = 1,97 (тыс.руб.) – среднее значение среднедушевых доходов;

уср = Σуi/8 = 1,4 (тыс.руб.) – среднее значение среднедушевых потребительских расходов.

Следовательно, b = 0,7877

а = уср – bxcp = 0,1971

Таким образом, искомое уравнение регрессии примет вид

ŷ = 0,1971 + 0,7877х

Найденное уравнение регрессии есть уравнение прямой, которая изображена на рис.

6.3. Мерой зависимости между переменными х и у может служить выборочный коэффициент парной корреляции, который обозначается через rxy и определяется по формуле:

nΣxiyi – ΣxiΣyi

rxy = ————————,

√nΣxi2 – (Σxi)2 √ nΣуi2 – (Σуi)2

Подставляя соответствующие значения из последней строки табл.1, получаем

rxy = 0.985, rxy > 0 и близко к 1, следовательно, связъ сильная положительная, т.е. при увеличении доходов, расходы растут.

Для того, чтобы с большей уверенностью делать вывод о наличии или отсутствии линейной взаимосвязи между переменными х и у, разработан критерий проверки того, существенно ли отличие коэффициента корреляции от нуля или, другими словами, значимо ли значение коэффициента корреляции. Если в результате проверки выясняется, что коэффициент корреляции существенно отличается от нуля, то, несмотря даже на не очень близкое значение коэффициента к единице, делается вывод о наличии линейной взаимосвязи между переменными х и у. Если же подтверждается несущественное отличие rxy от нуля, то, не смотря на возможно достаточно большое значение коэффициента, делается вывод об отсутствии линейной взаимосвязи между переменными.

Проверка существенности отличия коэффициента корреляции от нуля проводится по схеме:

│ rxy √ n-2 │

если │  │ > t1-α/2,n-2 ,

√1 – rxy2

то гипотеза о существенном отличии коэффициента корреляции от нуля принимается, в противном случае отвергается.

Здесь t1-α/2,n-2 – квантиль распределения Стьюдента, α - уровень значимости или уровень доверия, n – число наблюдений, (n-2) – число степеней свободы. Значение α задается исследователем зависимости между х и у. Примем α = 0,1, тогда t1-α/2,n-2 = t0,975,6 = 2,1604

.

rxy √ n-2 0,848√8-2

 =  = 5,77 > t0,975,6

√1 – rxy2 √1- 0,9852

Следовательно, коэффициент корреляции существенно отличается от нуля и существует сильная линейная связь между х и у. Т.е. если мы будем проводить многократное повторение эксперимента по исследованию зависимости между доходами и расходами, всякий раз выбирая различные группы из 8 субъектов РФ, то в 90% этих экспериментов будет обнаружена тесная линейная зависимость между х и у, т.е. в 90% случаев коэффициент корреляции rxy будет существенно отличатся от нуля.

6.4.Точечным прогнозом значения зависимой переменной у, соответствующего некоторому значению независимой переменной х = х0, называется значение ŷ0, получаемое путем подстановки в уравнение регрессии х = х0, т.е.

ŷ0 = ŷ(х0)= a + bx0 – точечный прогноз.

Найдем точечный прогноз среднемесячных потребительских расходов в 8-ом субъекте РФ в будущем периоде, что среденемесячные денежные доходы в этом субъекте увеличатся на 30%, т.е.

х0 = х8 + 0,3х8 = 1,5х8 =2,587

ŷ0 = 0,1971 + 0,78772,587 = 1,756 (тыс.руб.).

Таким образом, если среднемесячные денежные доходы в 8-м субъекте РФ увеличатся на 30%, то потребительские расходы в этом субъекте составят 1,756 тыс.руб.

Интервальным прогнозом зависимой переменной у, соответствующим некоторому значению независимой переменной х = х0, называется доверительный интервал, границы которого находятся по формуле: ŷв.н. = ŷ(х0) ± t1-α/2,n-2Sŷ,

где ув, ун – соответственно верхняя и нижняя границы доверительного интервала;

ŷ(х0) – точечный прогноз;

t1-α/2,n-2 –квантиль распределения Стьюдента;

(1-α/2) – доверительная верояность;

(n-2) – число степеней свободы;

/ 1 (x0 – xcp) (ŷi - yi)2

Sŷ = S √  +  , S = √S2 , S2 = ,

n (xi – xcp)2 n-2

Доверительный интервал – это такой интервал, в котором с заданной вероятностью будет находиться прогнозируемое значение зависимой переменной у.

Найдем интервальный прогноз среднемесячных потребительских расходов в 10-м субъекте РФ в будущем периоде предполагая, что среднемесячные денежные доходы в этом субъекте РФ увеличатся на 30%.

Ранее вычислено ожидаемое значение денежных доходов х0 = 2,587 тыс.руб.

Пусть α = 0,1, тогда 1-α = 0,9; t1-α/2,n-2 = t0,975,6 = 2,1604;

(ŷi - yi)2 0,568 .

S2 =  =  = 0,044; S = √ 0.052 = 0.209

n – 2 6

0 - хср)2 = (2,587 – 1,97)2 = 0,381

(xi - xcp)2 = хi2 – n(xcp)2 = 62,58 - 151.972 = 4,3665.

_______________ ____________

/ 1 (x0 – xcp)2 / 1 0,381

Sŷ = S √  +  = 0.209 √  +  = 0,082

n (xi – xcp)2 8 4,3665

Следовательно, ŷн = 1,756 – 0,082 = 1,674 (тыс.руб.)

ŷв = 1,756 + 0,082 = 1,838 (тыс.руб.)

Это означает, что при увеличении среднедушевых среднемесячных денежных доходов на 30%, т.е. с 1,99 тыс.руб. до 2,587 тыс.руб., размер среднедушевых среднемесячных потребительских расходов с вероятностью 0,90 будет колебаться в пределах от 1,674 тыс.руб. до 1,838 тыс.руб.

6.5. Рассмотрим найденное уравнение регрессии ŷ =0,1971 + 0,7877х. Коэффициент а = 0,1971 не имеет экономического смысла, поскольку формально соответствует размеру потребительских расходов при нулевом уровне денежных доходов. Коэффициент b = 0,7877 определяет прирост потребительских расходов, обусловленный приростом денежных доходов.

Содержательная интерпретация всех остальных понятий и формул, использованных в данной задаче была приведена по ходу решения.

В заключение впишем итоговые результаты.

  1. у = α + βх + u – математическая модель зависимости потребительских расходов от денежных доходов.

  2. ŷ = 00,1971 + 0,7877х – уравнение регрессии, количественно выражающее зависимость расходов от доходов.

  3. rxy = 0.985– коэффициент корреляции между х и у, его значение свидетельствует о достаточно тесной линейной зависимости расходов и доходов.

4. ŷ00) = 1,756 (тыс.руб.) – точечный прогноз;

ŷн = 1,674 (тыс.руб.)

ŷв = 1,838 (тыс.руб.) - интервальный прогноз с 90% доверительной вероятностью.