
- •Содержание
- •Введение
- •Кластерный анализ
- •Принцип дальнего соседа:
- •Принцип средней связи:
- •Принцип центра тяжести
- •Нелинейная регрессия
- •Прогнозирование величины прожиточного минимума на основе временного ряда
- •Важнейшие показатели изменения уровней рядов динамики
- •Акф и стационарность временного ряда
- •Сглаживание временных рядов с помощью скользящих средних
- •Проверка гипотезы о существовании тренда с помощью критерия «восходящих и нисходящих» серий
- •Выбор кривой роста. Подбор параметров уравнения регрессии
- •Моделирование сезонных колебаний
- •Оценка адекватности и точности построенной модели
- •Прогнозирование на основе построенной модели временного ряда
Содержание
Введение
Кластерный анализ
система эконометрических уравнений
Прогнозирование величины прожиточного минимума на основе временных рядов
Важнейшие показатели изменения уровней рядов динамики
АКФ и стационарность временного ряда
Сглаживание временных рядов с помощью скользящих средних
Проверка гипотезы о существовании тренда с помощью критерия «восходящих и нисходящих» серий
Выбор кривой роста. Подбор параметров уравнения регрессии
Моделирование сезонных колебаний
Оценка адекватности и точности построенной модели
Прогнозирование
Заключение
Введение
Кластерный анализ
№ |
1 |
2 |
3 |
4 |
Хi1 |
7 |
4 |
5 |
3 |
Xi2 |
5 |
9 |
4 |
7 |
Обычное евклидово расстояние
ρ12
=
ρ13
=
ρ14
=
ρ23
=
ρ24
=
ρ34
=
Принцип ближайшего соседа:
R1=
S1, S(2,4), S3
ρ1
(2,4) =
ρ (S1
,
S(2,4))
= ½ ρ12
+ ½ ρ14
- ½
R2=
ρ(2,4)
3 =
ρ (S2,4
,
S3)
= ½ ρ23
+ ½ ρ43
- ½
S(1,3), S(2,4)
R3
=
Принцип дальнего соседа:
R1=
S1, S(2,4), S3
ρ1
(2,4) =
ρ (S1
,
S(2,4))
= ½ ρ12
+ ½ ρ14
+ ½
R2=
S(1,3), S(2,4)
R3
=
Принцип средней связи:
R1=
S1, S(2,4), S3
=
=
ρ(2,4),1
=
ρ(2,4),3
=
R2=
S(1,3), S(2,4)
=
=
ρ(1,3),(2,4)
=
R3
=
Принцип центра тяжести
R1=
S1, S(2,4), S3
S(2,4)1= ½*(ρ12+ ρ14)= ½*(5+4,47)=4,735
S(2,4)3= ½*(ρ23+ ρ43)= ½*(5,1+3,61)=4,355
R2=
S(1,3)(2,4)= 1/4*(ρ12+ ρ14+ ρ32+ ρ34)= 1/4*(5+4,47+5,1+3,61)=4,545
R3
=
Взвешенное евклидово расстояние
W1=0,07
W2=0,93
ρ12
=
ρ13
=
ρ14
=
ρ23
=
ρ24
=
ρ34
=
Принцип ближнего соседа:
R1=
S(1,3), S2, S4
R2=
S(1,3), S(2,4)
R3
=
Принцип дальнего соседа:
R1=
S(1,3), S2, S4
R2=
S(1,3), S(2,4)
R3
=
Принцип средней связи:
R1=
S(1,3), S2, S4
= =
ρ(1,3),2
=
ρ(1,3),4
=
R2=
S(1,3), S(2,4)
=
ρ(1,3),(2,4)
=
R3
=
Принцип центра тяжести
R1=
S(1,3), S2, S4
S(1,3)2= ½*(ρ12+ ρ32)= ½*(3,94+4,83)=4,385
S(1,3)4= ½*(ρ14+ ρ34)= ½*(2,2+2,94)=2,57
R2=
S(1,3)(2,4)= 1/4*(ρ12+ ρ14+ ρ32+ ρ34)= 1/4*(3,94+2,2+4,83+2,94)=3,48
R3
=
Вывод: данное разбиение является единственным возможным вариантом разбиения на кластеры.
Нелинейная регрессия
.
X |
11 |
14 |
16 |
19 |
22 |
25 |
Y |
54 |
43 |
39 |
34 |
29 |
27 |
Пусть
,
тогда
.
№ |
y |
z |
y*z |
z2 |
y2 |
ŷ |
y- ŷ |
(y- ŷ)2 |
Ai, % |
1 |
54 |
0,09 |
4,86 |
0,0081 |
2916 |
48,05 |
5,95 |
35,4 |
11% |
2 |
43 |
0,07 |
3 |
0,0049 |
1849 |
41,15 |
1,85 |
3,4 |
4,3% |
3 |
39 |
0,0625 |
2,44 |
0,0039 |
1521 |
38,563 |
0,437 |
0,19 |
1,12% |
4 |
34 |
0,053 |
1,8 |
0,0028 |
1156 |
35,285 |
-1,285 |
1,651 |
3,78% |
5 |
29 |
0,045 |
1,3 |
0,002 |
841 |
32,525 |
-3,525 |
12,4 |
12% |
6 |
27 |
0,04 |
1,08 |
0,0016 |
729 |
30,8 |
-3,8 |
14,44 |
14% |
∑ |
226 |
0,362 |
14,48 |
0,0233 |
9012 |
226,373 |
-0,373 |
67,481 |
46,2% |
Ср. знач. |
37,7 |
0,06 |
2,4 |
0,004 |
1502 |
37,73 |
-0,062 |
11,25 |
7,7% |
Рассчитаем коэффициенты регрессии a, b:
.
Получим
уравнение регрессии:
Уравнение показывает, что с увеличением числа занятых на 1 чел., объем производства возрастает на 345 тыс.ед.
Тесноту линейной связи оценит коэффициент корреляции:
– коэффициент
детерминации.
Это
означает, что на 59% вариации объема
производства (y)
объясняется вариацией фактора
– численность занятых.
показывает сильную связь между факторами.
Качество модели определяет средняя ошибка аппроксимации(см. табл. ):
Качество
построенной модели оценивается как
хорошее, т.к.
не должно превышать 8-10%.
Посчитаем остаточную дисперсию:
Посчитаем средний коэффициент эластичности:
То есть увеличение численности занятых на 1% увеличивает объем производства на 0,55%.
Оценку значимости уравнения регрессии целом дает F-критерий Фишера. Фактическое значение F-критерия:
(при
n=6).
Следовательно, статистическая значимость
уравнения регрессии не подтверждается.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем t-критерий Стьюдента. Рассчитаем случайные ошибки параметров линейной регрессии и корреляции:
Фактические значения t-статистик :
Табличное значение t-критерия Стьюдента при α=0,05 и числе степеней свободы v=n-2=4 есть 2,7764.
Значит,
,
.
Следовательно, признается статистическая
значимость параметров регрессии, но не
признается статистическая значимость
показателя тесноты связи.