- •Методические указания и индивидуальные задания для выполнения ргр
- •Содержание заданий
- •Тема. Группировка данных статистического наблюдения.
- •Тема. Ряды динамики.
- •1 Этап.
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6.
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Вариант 11
- •Вариант 12
- •Вариант 13
- •Вариант 14
- •Вариант 15
- •Вариант 16
- •Вариант 17
- •Вариант 18
- •Вариант 19
- •Вариант 21.
- •Вариант 22
- •Вариант 23
- •Вариант 24
- •Вариант 25
- •Вариант 26
- •Исходные данные для выполнения ргр 3 (ряды динамики)
- •2 Этап.
- •Тема. Группировка данных статистического наблюдения.
- •1.2. Построение структурной группировки.
- •Тема. Показатели вариации.
- •Средняя из этих групповых дисперсий.
- •Межгрупповая дисперсия.
- •Тема: Ряды динамики.
- •Графическое представление ряда динамики дано на рис. 3.1
- •2 Этап Изучение сезонных колебаний в рядах динамики. Исходные данные для решения.
- •Тема. Корреляционно – регрессионный анализ.
Это означает, что за период с 1996 – 2010 года сбор перца ежегодно снижался на 0,042 млн. тонн.
Среднегодовой темп роста вычисляется по формуле средней геометрической из коэффициентов роста. Если использовать свойство, что произведение всех цепных коэффициентов роста равно конечному базисному коэффициенту роста , то получим :
100
= 96,7%
Значит за период с 1996 г по 2010г средний темп роста сбора перца составил
96.7%. И средний темп прироста за этот период составил
=
96,7 – 100 = - 3,3%
Значит за этот период в среднем ежегодно производство перца в хозяйстве снижалось на 3,3%.
4. Нужно произвести сглаживание ряда динамики с помощью скользящей средней и аналитического выравнивания.
Важной задачей статистики при анализе рядов динамики является определение основной тенденции развития. Часто эту задачу называют сглаживанием или выравниванием ряда динамики.
В рядах динамики при изучении основной тенденцией развития явления применяются различные приемы и методы. Одним из приемов является метод скользящей средней. Суть метода состоит в замене абсолютных данных средними арифметическими за определённые периоды. Расчёт средних ведется способом скольжения, т.е. постепенным исключением первого уровня из принятого периода скольжения и включением следующего.
При этом принято скользящие суммы относить к концу периода скольжения, а скользящие средние - к центру периода. В тех случаях, когда период скольжения имеет четное число уровней, приходится дополнительно центрировать полученные уровни, При этом окончательный уровень ряда находят как полусумму соседних (промежуточных).
СПОСОБ СКОЛЬЗЯЩЕЙ СРЕДНЕЙ
«Динамика валового сбора перца, выращиваемого хозяйством “Московский” Расчёт скользящих средних
Таблица 3.3
Год |
Перец, млн.т. |
Нечетный период скольжения |
Чётный период скольжения |
|||
Скользящая сумма за 3 года |
Скользящая средняя за 3 года |
Скользящая сумма за 4 года |
Скользящая средняя за 4 года |
Центрированная скользящая средняя |
||
А |
1 |
2 |
3 |
4 |
5 |
6 |
1996 |
1,57 |
- |
- |
-
|
|
- |
1997 |
1,79 |
- |
1,45 |
- |
- |
|
1,3 |
||||||
1998 |
1,00 |
4,36 |
1,22 |
- |
1,25 |
|
1,2
|
||||||
1999 |
0,87 |
3,66 |
1,03 |
5,23
|
1,14 |
|
1,08 |
||||||
2000 |
1,23 |
3,1 |
1,1 |
4,89
|
1,09 |
|
1,1 |
||||||
2001 |
1,21 |
3,31 |
1,23 |
4,31
|
1,095 |
|
1,09 |
||||||
2002 |
1,26 |
3,7 |
1,04 |
4,57
|
1,08 |
|
1,07 |
||||||
2003 |
0,66 |
3,13 |
1,02 |
4,36
|
1,015 |
|
0,96 |
||||||
2004 |
1,13 |
3.05 |
0,86 |
4,26
|
0,87 |
|
0,78 |
||||||
2005 |
0,78 |
2,57 |
0,82 |
3,83
|
0,77 |
|
0,76 |
||||||
2006 |
0,54 |
2,45 |
0,63 |
3,11
|
0,705 |
|
0,65 |
||||||
2007 |
0,57 |
1,89 |
0,6 |
3,02 |
0,67 |
|
0,69 |
||||||
2008 |
0,69 |
1.8 |
0,74 |
2,58
|
0,745 |
|
0,8 |
||||||
2009 |
0,95 |
2,21 |
0,87 |
2,75
|
- |
|
|
||||||
2010 |
0,98 |
2,62 |
- |
3,19 |
- |
|
Пояснения к расчёту:
В графе [2] таблицы 3.3 представлены скользящие суммы за 3
года. Они рассчитываются так:
Например, для 1996 – 1998: 1,57+1,79+1 = 4,36
В графе [3] представлены скользящие средние за 3 года. Они
рассчитываются так:
Например,
для 1996 – 1998 г.г :
= 1,45
В графе [4] представлены скользящие суммы за 4 года. Они рассчитываются так:
Например, для 1996 – 1999 г.г: 1,57+1,79+1+0,87 = 5,23
В графе [5] представлены скользящие средние за 4 года. Они рассчитываются так:
Например,
для 1996 – 1999 г.г:
В графе [6] представлена центрированная скользящая средняя. Она рассчитывается так:
Например:
= 1,25
Заметим, что , чем больше период скольжения, тем больше мы теряем крайних уровней.
Результаты выравнивания ряда динамики с использованием скользящих средних с начетным и четным периодами скольжения графически проиллюстрированы на рис. 3.2.
СПОСОБ АНАЛИТИЧЕСКОГО ВЫРАВНИВАНИЯ.
При
этом уровни ряда динамики выражаются
в виде функции времени:
=
f
(
).
Эта функция называется аналитическим
трендом. Найдем для данной задачи
линейную модель тренда
=
+
. Говорят, что ряд динамики выравниваем
по прямой. Коэффициенты модели находим
методом наименьших квадратов.
Применение метода наименьших квадратов приводит к системе двух нормальных уравнений для нахождения параметров модели а0 и а1:
a0n
+a1∑
= ∑
a0∑
+a1∑
= ∑
;
где
текущий
уровень ряда динамики;
n – число членов ряда;
– показатель времени, который обозначается порядковыми номерами, начиная с 1 (1996 г - начало периода),см. графу [2] табл. 4.1.
Систему
уравнений можно значительно упростить,
если принять условный отсчет времени
,
это отсчет от условного нуля так, чтобы
.
Тогда
из
первого уравнения системы получим,
,
откуда сразу следует
.
Отсюда
следует экономический смысл коэффициента
в уравнении линейного тренда ряда
динамики. При условном отсчете
времени
это средний уровень ряда динамики.
Второе
уравнение станет:
=
.
Отсюда получаем, что
=
Вычисления приведены в табличной форме (таблица 3.4 ).
Динамика валового сбора перца, выращиваемого хозяйством “Московский” Расчёт аналитической модели
Таблица 3.4
Год |
Перец, млн.т. |
|
τi |
τ2i |
yi×τi |
|
( -yi)2 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1996 |
1,57 |
1 |
- 7 |
49 |
- 10,99 |
1,37 |
0,24 |
1997 |
1,79 |
2 |
- 6 |
36 |
- 10,74 |
1,32 |
0,22 |
1998 |
1,00 |
3 |
- 5 |
25 |
- 5,00 |
1,27 |
0,073 |
1999 |
0,87 |
4 |
- 4 |
16 |
- 3,48 |
1,22 |
0,123 |
2000 |
1,23 |
5 |
- 3 |
9 |
- 3,69 |
1,17 |
0,0036 |
2001 |
1,21 |
6 |
- 2 |
4 |
- 2,42 |
1,12 |
0,0081 |
2002 |
1,26 |
7 |
- 1 |
1 |
- 1,26 |
1,07 |
0,0361 |
2003 |
0,66 |
8 |
0 |
0 |
0 |
1,02 |
0,1296 |
2004 |
1,13 |
9 |
1 |
1 |
1,13 |
0,97 |
0,0256 |
2005 |
0,78 |
10 |
2 |
4 |
1,56 |
0,92 |
0,0196 |
2006 |
0,54 |
11 |
3 |
9 |
1,62 |
0,87 |
0,1089 |
2007 |
0,57 |
12 |
4 |
16 |
2,28 |
0,82 |
0,0625 |
2008 |
0,69 |
13 |
5 |
25 |
3,45 |
0,77 |
0,0064 |
2009 |
0,95 |
14 |
6 |
36 |
5,76 |
0,72 |
0,0529 |
2010 |
0,98 |
15 |
7 |
49 |
6,86 |
0,67 |
0,0961 |
Итого
|
15,23 |
|
|
280 |
- 14,92 |
15,3 |
1,2054 |
Используя данные, приведенные в таблице, найдем
=
1,02 (см. также средний уровень ряда
динамики.)
И в результате получаем уравнение тренда:
Расчет теоретических уровней, рассчитанных по этой формуле представлен в графе [6] таблицы 3.4.
Основная тенденция (тренд) показывает, как воздействуют систематические факторы на изменение уровней ряда динамики, а колеблемость уровней ряда относительно тренда служит мерой влияния случайных (остаточных) факторов. Случайную составляющую оценивают по величине остаточной дисперсии и среднего квадратического отклонения по формулам:
и
Используя данные таблицы, получим для нашего случая:
и
= 0,283
Относительной мерой колеблемости является коэффициент вариации, который вычисляется по формуле:
Для
нашего случая получим
( или 27,7%)
Прогнозирование по аналитической модели тренда.
Предполагая, что существующая тенденция сохранится и в дальнейшем, можно сделать прогноз на два последующих уровня динамики:
На 2011 год:
τ
=
8
На 2012 год:
τ
=
9
млн.т
Графические изображения исследования динамики
представлено на рис 3.2
2 Этап Изучение сезонных колебаний в рядах динамики. Исходные данные для решения.
Продажа кондиционеров одной из фирм ООО «Климат»
за период с 2008 по 2010 гг., шт.
Месяц |
2008 |
2009 |
2010 |
1 |
2 |
3 |
4 |
Январь |
58 |
44 |
68 |
Февраль |
44 |
49 |
51 |
Март |
34 |
35 |
43 |
Апрель |
83 |
66 |
54 |
Май |
150 |
185 |
153 |
Июнь |
177 |
194 |
175 |
Июль |
154 |
157 |
180 |
Август |
144 |
161 |
193 |
Сентябрь |
124 |
108 |
140 |
Октябрь |
84 |
74 |
112 |
Ноябрь |
72 |
74 |
86 |
Декабрь |
75 |
81 |
91 |
При анализе рядов динамики важное значение имеет выявление сезонных колебаний. Этим колебаниям свойственны более или менее устойчивые изменения уровней ряда по внутригодовым периодам
Для выявления основной тенденции данного ряда динамики и проверки на наличие сезонной компоненты используем метод укрупнения интервалов. Перейдем к квартальным уровням .
Таблица 3.5.
-
Год
Квартал
Продано кондиционеров, шт.
1
2
3
2009
1
136
2
410
3
422
4
231
2010
1
128
2
445
3
426
4
229
2011
1
162
2
382
3
513
4
289
Ряд динамики, представленный в таблице 3.5 (графа [3]) проиллюстрирован круговой диаграммой динамики рис. 3.3, где отчетливо проявляется наличие сезонности в 3-ем квартале.
Рис. 3.3.
Продажи
кондиционеров увеличиваются с каждым
годом. Так за 2009 году было продано 136 +
410 + 422 + 231 = 1199 кондиционеров. А в 2011 году
162 + 382 + 513 + 289 = 1346 кондиционеров,
.
Следовательно ряд динамики имеет
тенденцию развития. В этом случае индексы
сезонности находим методом «переменной
средней».
Для характеристики тенденции выберем линейный тренд.
Расчеты
приведены в таблице 3.6. Аналогично
предыдущему этапу здесь приняли отсчет
времени от условного нуля таким образом,
чтобы
= 0, для четного числа уровней ряда выбор
условного отсчета времени представлен
в графе [5]
таблицы 3.6.
Расчет параметров линейного тренда и определение индексов сезонности
Таблица 3.6.
№ |
год |
квартал |
yi |
τi |
τi2 |
yi τi |
|
isi , % |
|
|
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
||||||||
1 |
2008 |
I |
136 |
- 11 |
121 |
- 1496 |
270,73 |
50,2 |
47,0 |
127,3 |
||||||||
2 |
II |
410 |
- 9 |
81 |
- 3690 |
278,67 |
147,1 |
134 |
373,5 |
|||||||||
3 |
III |
422 |
- 7 |
49 |
- 2954 |
286,61 |
147,2 |
142,5 |
408,5 |
|||||||||
4 |
IV |
231 |
- 5 |
25 |
- 1155 |
294,55 |
78,4 |
76,4 |
225,1 |
|||||||||
5 |
2009 |
I |
128 |
- 3 |
9 |
- 384 |
302,49 |
42,3 |
47,0 |
142,2 |
||||||||
6 |
II |
445 |
- 1 |
1 |
- 445 |
310,43 |
143,3 |
134 |
416,1 |
|||||||||
7 |
III |
426 |
1 |
1 |
426 |
318,37 |
133,8 |
142,5 |
453,7 |
|||||||||
8 |
IV |
229 |
3 |
9 |
687 |
326,31 |
70,2 |
76,4 |
249,2 |
|||||||||
9 |
2010 |
I |
162 |
5 |
25 |
810 |
334,25 |
48,5 |
47,0 |
157 |
||||||||
10 |
II |
382 |
7 |
49 |
2674 |
342,19 |
111,6 |
134 |
458,7 |
|||||||||
11 |
III |
513 |
9 |
81 |
4617 |
350,13 |
146,5 |
142,5 |
499 |
|||||||||
12 |
IV |
289 |
11 |
121 |
3179 |
358,07 |
80,7 |
76,4 |
273,6 |
|||||||||
Итого: |
3773 |
- |
572 |
2269 |
3773 |
- |
- |
- |
||||||||||
Расчёт:
В результате получаем уравнение основной тенденции продажи кондиционеров за период с 2009 по 2011 годы
=
314,4 + 3,97τ
В графе [8] таблицы 3.6 представлены рассчитанные по аналитическому уравнению значения продажи кондиционеров по каждому кварталу.
В
графе [9]
рассчитываем для каждого квартала
, как отношение
фактических уровней (графа [4]) к соответствующим им расчетным уровням (графа [8]) и заполняем графу [9].
=
100%
Это индексы сезонности, рассчитанные для каждого периода времени. В нашем случае по каждому кварталу. Расчеты, приведенные в графе [9] таблицы 3.6., показывают, что значения индексов сезонности по кварталам различаются. Поэтому окончательные значения индексов сезонности находят как среднюю арифметическую одноименных кварталов.
Таким способом находим общий среднеквартальный уровень и заполняем графу [10].
Итак, получаем:
для
первого квартала
=
;
для
второго квартала
= 134%;
для
третьего квартала
= 142,5%;
для
четвертого квартала
= 76,4%
Проверка.
Сумма
всех индексов сезонности в нашем случае
должна равняться 400%, а среднее значение
всех индексов сезонности должно равняться
100. У нас
= 100%.
Замечание.
Если расчет ведется по 12 месяцам года, то сумма всех индексов сезонности должна равняться 1200, а средняя 100%.
Результаты расчета графа [10] показывают, что имеет место резкое увеличение объема продаж кондиционеров во втором и третьем кварталах и снижение продаж в четвертом и первом кварталах.
Можно оценить степень колеблемости ряда динамики, которая вызвана сезонностью, используя
Для нашего ряда динамики получим, что
39,8%
Видим, что сезонность достаточная сильная.
Найденные в графе [10] таблицы 3.6 индексы сезонности позволяют скорректировать полученное ранее уравнение основной тенденции ряда:
=
(
,
здесь
значение
ОБЯЗАТЕЛЬНО берется в коэффициентах,
а не в процентах.
Результаты расчетов скорректированных с учетом сезонности уровней ряда динамики представлены в графе [11] таблицы 3.6 и на графике рис.3.4
Рис. 3.4. Графическая иллюстрация сезонности
Предложенная
здесь модель учета влияния сезонности
для получения скорректированных
теоретических значений уровней ряда
называется мультипликативной. Возможна
и другая модель учета сезонной волны,
аддитивная. В этом случае к найденному
тренду
прибавляют среднюю величину абсолютного
отклонения
и значения
находят по формуле:
.
Читателю предлагается провести расчет и по аддитивной модели учета сезонности и сравнить результаты.
РГР 4.
Тема. Корреляционно – регрессионный анализ.
В РГР 1 методом аналитической группировки была выявлена зависимость между капиталом банка и прибылью. Метод группировок часто используется для выявления корреляционной связи между двумя признаками при большом числе наблюдений. Чтобы установить наличие и направление связи между признаками в этом случае бывает достаточно построения корреляционной таблицы.
Задачей регрессионного анализа является нахождение аналитического выражения (математическая модель) этой связи. Другими словами надо найти уравнение регрессии, которое должно ответить на вопрос, каким будет среднее значение результативного признака при том или ином значении факторного.
Рассчитанные по уравнению регрессии значения результативного признака часто называются теоретическими и обозначаются .
Зависимость прибыли банка от капитала, наличие которой установили в РГР 1, теперь дополним регрессионным анализом.
Для этого построим линейное уравнение регрессии
=
На практике линейная зависимость является наиболее часто используемой функцией, она хорошо изучена и очень удобна для оценочных расчетов.
Но в нашей задаче по виду поля корреляции, представленного на рис 1.6, можно выдвинуть гипотезу, что капитал и прибыль связаны линейной зависимостью.
Примем следующие обозначения:
- теоретическое (расчетное) значение результативного признака. В нашей задаче – это прибыль.
х– значение факторного признака, у нас – капитал.
Для нахождения уравнения регрессии (параметров и ) используем метод наименьших квадратов,. Метод заключается в том, что находят такие значения параметров и , которые обеспечат минимальность суммы квадратов отклонений фактических значений результативного признака от их теоретических значений, рассчитанных по уравнению регрессии. Значит нужно найти минимум функции двух переменных
.
Поиск минимума функции 2-х переменных приводит к системе двух линейных уравнений.
Для решения этой системы нужно, используя исходные данные, найти числовые значения коэффициентов в уравнения системы. Это значения:
.
Все необходимые для этого расчеты
представлены в таблице 4.1
Таблица 4.1
Чтобы избежать вычислений с многозначными показателями, упростим систему, разделив почленно каждое уравнения на п.
Тогда система уравнений примет вид:
Решая эту систему из первого уравнения получаем, что
,
а
из второго
+
Откуда сразу получаем выражение для :
В
итоговой строке таблицы 4.1 для вычисления
есть
все необходимые показатели.
Из
графы [2] следует
;
из
графы [3] следует
;
из
графы [4] следует
=
из
графы [5] следует
Найдем
– называется коэффициентом регрессии. Он показывает, на сколько изменится значение результативного признака при увеличении факторного на единицу собственного измерения. В нашей задаче: при увеличении капитала банка на 1 д.е его прибыль вырастет (т.к знак «+» ) на 1,11 д.е.
Заметим,
что в знаменателе выражения для
стоит дисперсия, следовательно
,
тогда
= 11,23
Получили уравнение регрессии:
В графе [7] таблицы 4.1 приведены значения , рассчитанные по этому уравнению. В графах [8], [9] и [10] рассчитываются показатели необходимые для оценки полученного уравнения.
Фактические значения прибыли отклоняются от расчетных, величину этих отклонений оценивают с помощью остаточной дисперсии и коэффициента вариации.
и
=
.
В нашем случае получим, что
Очевидно,
что числитель этой дроби есть итоговый
показатель графы [9]. Тогда
=
3,6 и
8,8%.
Количественно
оценить отклонения фактических значений
результативного признака от рассчитанных
по полученному уравнению регрессии
помогает также величина средней ошибки
аппроксимации
.
В графе [10] таблицы 4.1 для каждого значения
посчитана ошибка аппроксимации
Тогда средняя ошибка аппроксимации получается равной
=
7%.
Следовательно, рассчитанные по уравнению регрессии значения прибыли, достаточно хорошо согласуются с фактическими.
Тесноту
взаимосвязи между изучаемыми признаками
в случае линейного уравнения регрессии
оценивает линейный коэффициент корреляции
:
Найдем . Для нашей задачи он получается равным:
= 0,956
Это
говорит об очень тесной взаимосвязи
между признаками. Коэффициент детерминации
при этом равен
, следовательно, 91,4% вариации прибыли
обусловлено вариацией капитала.
Чтобы проверить, на сколько значимы полученные показатели регрессии и корреляции, не являются ли они результатом действия случайных факторов, воспользуемся t-статистикой Стьюдента.
Выдвигаем
гипотезу
о случайной природе полученных значений,
а в действительности значения этих
показателей близки к нулю. Далее
рассчитываем значения случайных ошибок
параметров.
Для
параметра
=
= 17,8;
Для
параметра
Для коэффициента корреляции :
=
0,05
Расчетное значение t-критерия Стьюдента получаем путем составления значение параметра с величиной его случайной ошибки. Тогда
;
Существуют таблицы критических значений t-критерия Стьюдента, где по заданным значениям числа степеней свободы и требуемого уровня значимости находим табличное значение t-критерия.
Уровень
значимости это вероятность ошибки
первого рода, когда отвергают верную
гипотезу. Уровень значимости обозначают
обычно
Существует
еще ошибка второго рода, это ошибка,
когда принимается неверная гипотеза.
Вероятность ошибки второго рода
обозначают
Если
расчетные значения оказываются больше
табличных (критических), то нулевая
гипотеза
отвергается и найденные значения
считаем статистически значимыми. В
противном случае принимаем гипотезу
и корреляции сформировались под действием случайных факторов.
Зададим
в нашей задаче уровень значимости
, число степеней свободы
Тогда по таблице
Следовательно, нулевая гипотеза отвергается, т.к расчетные значения критерия больше табличного.
Полученное уравнение регрессии является статистически значимым и может быть использовано в исследовательской работе.
ЗАМЕЧАНИЕ К РГР4.
При определении параметров уравнения регрессии мы использовали табличную форму для расчетов (таблица 4.1).
В тех случаях, когда объем совокупности велик, выполнение подобных вычислений представляет собой технически очень трудоемкий процесс.
Использование корреляционной таблицы значительно сокращает вычисления. Для этого совокупность предварительно разбивают на группы по факторному и по результативному признаку.
Затем строят матрицу корреляции, элементами которой являются численность образованных групп совокупности. При этом группы по факторному и результативному признаку располагают по строкам и столбцам, соответственно.
В нашем случае в РГР1 банки уже сгруппированы по капиталу и по прибыли. Осталось построить корреляционную таблицу и проделать несложные вычисления.
Студентам предлагается самостоятельно найти уравнение регрессии с помощью корреляционной таблицы [2] и сравнить полученные результаты.
СПИСОК РЕКОМЕНДОВАННОЙ ЛИТЕРАТУРЫ.
ОСНОВНАЯ ЛИТЕРАТУРА.
«Теория статистики». Под ред. Р.А. Шмойловой. М.: Финансы и статистика , 2010, 656с.
«Практикум по теории статистики». М.: Финансы и статистика. 2010, 416 с.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА.
Громыко Г.Л. «Теория статистики» М: ИНФРА-М, 2012, 476 с.
Ефимова М.Р., Петрова Е.В., Румянцева В.Н. «Общая теория статистики». М: ИНФРА-М, 2100, 416 С.
Куренкоа А.М. «Статистика». Учебник. Перспектива 2012, 770 с.
СОДЕРЖАНИЕ.
Общие указания к выполнению работы………………………………..2
Содержание заданий……………………………………………………..3
Исходные данные для выполнения РГР1; РГР2; РГР4………………...5
Исходные данные для выполнения РГР3……………………………..57
Пример выполнения работы
РГР1……………………………………66
РГР2……………………………………82
РГР3: 1 этап…………………………...85
2 этап…………………………...97
РГР4…………………………………..104
Замечание к РГР4……………………………………………………..111
Список рекомендованной литературы……………………………….112

,
%
кор