0721_Hairullina_Ekonometrika_ProdUroven_Praktik_2021
.pdf
|
|
Таблица 4 |
|
Индикаторы достойного труда (фрагмент) |
|
|
|
|
|
Доля занятых лиц |
Государственные расходы |
Год |
в общей численности |
на социальную политику (Х), в |
|
населения (У), % |
% к ВВП |
2001 |
54,20 |
2,5 |
|
|
|
2002 |
60,20 |
5,8 |
|
|
|
2003 |
59,38 |
2,4 |
|
|
|
2004 |
60,33 |
2,4 |
|
|
|
2005 |
61,28 |
9,3 |
|
|
|
2006 |
61,66 |
8,8 |
|
|
|
2007 |
63,06 |
8,6 |
|
|
|
2008 |
63,25 |
9,1 |
|
|
|
2009 |
62,02 |
12,2 |
|
|
|
2010 |
62,70 |
13,3 |
|
|
|
2011 |
63,88 |
11,6 |
|
|
|
2012 |
64,91 |
11,4 |
|
|
|
2013 |
64,77 |
12 |
|
|
|
2014 |
65,37 |
11,1 |
|
|
|
2015 |
65,30 |
12,6 |
|
|
|
2016 |
65,68 |
12,7 |
|
|
|
2017 |
59,50 |
13,1 |
|
|
|
2018 |
59,80 |
11,9 |
|
|
|
2019 |
59,42 |
11,8 |
|
|
|
Требуется:
- построить линейное уравнение регрессии вида: Y = а0 + a1X + ε,
где а0, a1 – параметры уравнения (параметр а0 – свободный член регрессии; параметр a1 – коэффициент регрессии, который измеряет, на сколько единиц в среднем изменится результативный признак при изменении фактора на одну единицу;
ε – случайная ошибка.
Необходимо использовать данные таблицы 5.
11
Таблица 5
Рабочая таблица для построения линейного уравнения регрессии
Год |
х |
у |
ух |
х 2 |
у 2 |
2001 |
|
|
|
|
|
|
|
|
|
|
|
2002 |
|
|
|
|
|
|
|
|
|
|
|
2003 |
|
|
|
|
|
|
|
|
|
|
|
2004 |
|
|
|
|
|
|
|
|
|
|
|
2005 |
|
|
|
|
|
|
|
|
|
|
|
2006 |
|
|
|
|
|
|
|
|
|
|
|
2007 |
|
|
|
|
|
|
|
|
|
|
|
2008 |
|
|
|
|
|
|
|
|
|
|
|
2009 |
|
|
|
|
|
|
|
|
|
|
|
2010 |
|
|
|
|
|
|
|
|
|
|
|
2011 |
|
|
|
|
|
|
|
|
|
|
|
2012 |
|
|
|
|
|
|
|
|
|
|
|
2013 |
|
|
|
|
|
|
|
|
|
|
|
2014 |
|
|
|
|
|
|
|
|
|
|
|
2015 |
|
|
|
|
|
|
|
|
|
|
|
2016 |
|
|
|
|
|
|
|
|
|
|
|
2017 |
|
|
|
|
|
|
|
|
|
|
|
2018 |
|
|
|
|
|
|
|
|
|
|
|
2019 |
|
|
|
|
|
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
|
|
|
Среднее |
|
|
|
|
|
значение |
|
|
|
|
|
|
|
|
|
|
|
σ |
|
|
|
|
|
|
|
|
|
|
|
σ 2 |
|
|
|
|
|
Справочно. Для расчета параметра а1 необходимо использовать формулу:
1 = |
̅̅̅̅̅− ̅ ̅ |
||
|
|
. |
|
̅̅̅̅2 |
2 |
||
|
|
− ̅ |
Для расчета параметра а0 необходимо использовать формулу:
0 = ̅ − 1 ̅.
12
|
2 |
̅̅̅ |
2 |
|
|
|
2 |
||
|
|
= |
− ̅, |
|
|
|
|
|
где 2 – дисперсия признака х.
Задание 2.2.2
Исходные данные. Необходимо использовать исходные данные задания 2.2.1.
Требуется:
- рассчитать ошибку аппроксимации ( ̅) по формуле:
̅ |
1 |
|
− ̂ |
|
|
∑ | |
|
|
|
= |
|
|* 100%. |
Заполнить таблицу.
Таблица 6
Расчет ошибки аппроксимации
№ |
ŷх |
у - ŷх |
Аi |
(у - ŷх)2 |
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
Итого
Среднее значение
13
- рассчитать коэффициент парной корреляции (rxy) по формуле:
.
Справочно.
-если ах > 0, то 0 < rxy < 1 — связь между Y и X – прямая;
-если ах < 0, то — 1 < rху < 0 — связь между Y и X – обратная;
-если rху = 0, то линейная корреляционная связь отсутствует;
-если rху = +1 или -1, то корреляционная связь представляет линейную функциональную зависимость.
Для качественной оценки тесноты корреляционной связи необходимо использовать таблицу (шкалу) Чеддока.
Задание 2.2.3
Исходные данные. Необходимо использовать исходные данные задания 2.2.1 и задания 2.2.2.
Требуется:
-рассчитать компоненты дисперсии;
-оценить значимость уравнения регрессии в целом, ис-
пользуя критерий Фишера (F) по формулам на выбор:
2
F = * (n – 2).
1− 2
|
факт2 |
|
∑(̂ |
− ̅)2 |
|
F = |
|
= |
|
|
* (n – 2). |
2 |
∑( − ̂)2 |
||||
|
ост |
|
|
|
|
Справочно. Оценка значимости построенного уравнения регрессии в целом производится с помощью F — критерия Фишера. Оценить значимость уравнения регрессии - означает, что необходимо установить, соответствует ли регрессионная
14
модель, выражающая зависимость между переменными, экспериментальным данным н достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания результативной переменной.
Предварительно проводится дисперсионный анализ, центральное место в котором занимает разложение общей суммы квадратов отклонений зависимой переменной Y от ее выборочного среднего на две части (TSS — total sum of squares)-
«объясненную» (RSS -regression sum of squares) и «необъясненную» (ESS - error sum of squares), рисунок 2.
Рисунок 2. Компоненты дисперсии
Средние квадраты отклонений, или то же самое, что дисперсии на одну степень свободы, представляют собой несмещенные опенки дисперсий зависимой переменной, обусловленных соответственно регрессией или объясняющих переменных (одной или нескольких) и воздействием неучтенных случайных факторов и ошибок: к — число оцениваемых параметров: n - число наблюдений. Для линейной регрессионной модели с одной объясняющей переменной k=2 (k-1=1).
По критерию Фишера тестируется нулевая гипотеза, Но:факт2 = ост2 (факторная и остаточная дисперсии не отличаются друг от друга).
15
Критическое (табличное) значение F - критерия - это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности.
Если F> Fкр, то нулевая гипотеза Но: факт2 = ост2 при заданном уровне значимости отклоняется и делается вывод о существенности (достоверности) уравнения регрессии (связи между Y и X).
Если F < Fкр, то нулевая гипотеза Но: факт2 = ост2 уровне значимости принимается и делается вывод о несущественности (недостоверности, статистической незначимости) уравнения регрессии.
Задание 2.2.4
Исходные данные. Необходимо использовать исходные данные заданий 2.2.1-2.2.3. Для оценки качества подбора регрессионной модели, адекватности ее экспериментальным данным рассчитывается характеристика прогностической силы анализируемой регрессионной модели — коэффициент детерминации (R2 - статистика). Коэффициент детерминации характеризует долю дисперсии результативной переменной Y, объясненную регрессией, в общей дисперсии результативной переменной У, рассчитывается по формуле:
2 = 1 – = = факт = ∑(̂ − ̅)2.ост ∑( − ̅ )2
Требуется:
- рассчитать коэффициент детерминации.
Задание 2.2.5
Исходные данные. Необходимо использовать исходные данные заданий 2.2.1-2.2.3. Для линейной регрессионной мо-
16
дели с одной объясняющей переменной оценивают статистическую значимость не только уравнения в целом, но н отдельных его параметров. Для этого рассчитывается по каждому параметру стандартная ошибка:
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
√∑ =1( − ̂ ) |
|
|
|
|||||||||
|
|
= |
|
|
|
−2 |
|
|
|
. |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
√ |
|
|
|
|
|
||||||
|
1 |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
∑ |
( − ̂ )2 |
|
|
∑ |
2 |
||||||||
|
= √ |
=1 |
|
|
|
|
|
=1 |
|
. |
|||||
|
|
|
|
|
|
|
|
2 |
2 |
||||||
|
0 |
|
−2 |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
1−2 |
|
|
|
|
|
|
|
|||
|
= √ |
|
|
|
. |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
−2 |
|
|
|
|
|
|
|
Для оценки существенности коэффициентов уравнения регрессии сравниваются их величины с их стандартными ошибками, т.е. определить фактические значения t - статистик (критерия Стьюдента):
а1 = 1 .
1
0 = 0 .
0
= .
Требуется:
- по таблице Стьюдента с уровнем значимости α=0,05 и степенями свободы k сравнить крит с а1 , 0, и сделать вывод.
Задание 2.2.6
Исходные данные. Необходимо использовать исходные данные заданий 2.2.1-2.2.3, 2.2.5.
Доверительный интервал строится по формуле:
0 − крит 0 ≤ 0 ≤ 0 + крит 0.
17
В противном случае, если | 0| ≤ крит, нулевую гипотезу Н0 о несущественности (статистической незначимости, недостоверности) коэффициента регрессии 0 при заданном уровне значимости а можно принять.
Построить доверительный интервал оценки параметра уравнения регрессии 1 можно по формуле:
1 − крит 1 |
≤ 1 ≤ 1 + крит 1. |
||||||||||||||||||
Формула ошибки прогноза: |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
∑ ( − ̂ |
)2 |
|
|
|
1 |
|
( |
− ̅)2 |
|||||||
̂ |
= √ |
=1 |
|
|
∙ (1 + |
|
|
+ |
|
|
|
|
). |
||||||
|
−2 |
|
|
|
|
2 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
∙ |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
= √ |
|
|
|
1 |
|
|
( − ̅)2 |
|
|
|||||||
|
̂ |
∙ (1 + |
|
+ |
|
|
|
|
). |
|
|
||||||||
|
|
|
2 |
|
|
|
|||||||||||||
|
|
|
|
ост |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
∙ |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Предельная ошибка прогноза:
∆ = крит ∙ ̂ .
Требуется:
- составить точечный и интервальный прогноз доли занятых лиц в общей численности населения с вероятностью 0,95 и 0,90, принимая государственные расходы на социальную политику равным 15 и 20% от ВВП.
Задание 2.2.7
Исходные данные. Для определения предпочтений в приобретении мяса птицы был проведен опрос среди населения. Выборка составила 500 человек. В таблице приведены результаты (таблица 7).
|
|
|
|
|
|
|
Таблица 7 |
|
|
|
Результаты опроса, чел |
|
|
||
|
Предпочитают |
Предпочитают покупать определённые |
|||||
покупать тушку целиком |
части тушки (бедро, голень, грудку) |
||||||
Возраст |
|
Пол |
Возраст |
|
Пол |
||
|
|
Мужчины |
Женщины |
|
Мужчины |
Женщины |
|
До 20 |
|
50 |
80 |
До 20 |
30 |
|
50 |
20-40 |
|
20 |
40 |
20-40 |
50 |
|
60 |
Старше 40 |
|
35 |
70 |
Старше 40 |
5 |
|
10 |
18
Требуется:
- найти для каждой из следующих пропорций точечную оценку и 95% доверительный интервал: доля мужчин до 20 лет, которые предпочитают покупать определённые части тушки; долю молодёжи (до 20 лет), которая предпочитает покупать определённые части тушки; доля мужчин, предпочитающих покупать определённые части тушки; доля женщин, предпочитающих покупать определённые части тушки; доля населения, предпочитающего покупать определённые части тушки.
Задание 2.2.8
Исходные данные. Имеется официальная статистическая информация о среднемесячной номинальной начисленной заработной плате работников и ВВП, таблица 8.
|
|
Таблица 8 |
|
|
Данные для расчета |
|
|
|
Среднемесячная номинальная |
|
|
Год |
начисленная заработная плата |
ВВП, трлн руб. (Х) |
|
|
работников, тыс. руб. (У) |
|
|
2009 |
18,64 |
38,81 |
|
2010 |
20,95 |
46,31 |
|
2011 |
23,37 |
60,11 |
|
2012 |
26,63 |
68,10 |
|
2013 |
29,79 |
72,99 |
|
2014 |
32,50 |
79,03 |
|
2015 |
34,03 |
83,09 |
|
2016 |
36,71 |
85,62 |
|
2017 |
39,17 |
91,84 |
|
2018 |
43,72 |
104,63 |
|
Требуется:
-построить линейное уравнение регрессии;
-дать экономическую интерпретацию коэффициента регрессии a1;
-выполнить корреляционный анализ, сделать вывод о тесноте и направлении связи между Y и X;
19
-вычислить коэффициент детерминации. Сделать вывод;
-выполнить дисперсионный анализ. Протестировать статистическую гипотезу о достоверности уравнения регрессии при уровнях значимости а=0,05 и а=0,01;
-протестировать статистические гипотезы о достоверности коэффициента корреляции r и коэффициентов регрессии a0, а1 при уровне значимости а=0,05;
-построить доверительные интервалы для статистически значимых параметров;
-вычислить среднюю ошибку аппроксимации. Сделать вывод о возможности использования регрессионной модели для прогнозирования.
Задание 2.2.9
Исходные данные. Имеется официальная статистическая информация об инвестициях в основной капитал и ВВП, таблица 9.
Таблица 9
|
|
Данные для расчета |
||
Год |
ВВП, трлн руб. (У) |
Инвестиции в основной капитал, |
||
млрд руб. (Х) |
||||
|
|
|
||
2009 |
38,81 |
|
7,98 |
|
2010 |
46,31 |
|
9,15 |
|
2011 |
60,11 |
|
11,04 |
|
2012 |
68,10 |
|
12,59 |
|
2013 |
72,99 |
|
13,45 |
|
2014 |
79,03 |
|
13,90 |
|
2015 |
83,09 |
|
13,90 |
|
2016 |
85,62 |
|
14,75 |
|
2017 |
91,84 |
|
16,03 |
|
2018 |
104,63 |
|
17,78 |
Требуется:
-построить линейное уравнение регрессии;
-дать экономическую интерпретацию коэффициента регрессии a1;
20