![](/user_photo/2706_HbeT2.jpg)
- •1 . Корреляционный анализ
- •1.1. Построение рядов распределения по факторному и результативному признакам
- •1.2. Построение поля корреляции
- •1.3. Построение корреляционной таблицы
- •1.6. Измерение тесноты связи
- •2. Определение показателей вариации
- •2.1. Вычисление показателей вариации
- •3) Определение показателей вариации
- •2.2. Вычисление дисперсий
- •3. Анализ динамических рядов
- •3.1. Вычисление показателей динамики
- •3.2. Установление наличия тренда
- •3.3. Прогнозирование динамического ряда
- •3.4. Анализ полученных результатов
3.2. Установление наличия тренда
Проверка ряда динамики на наличие в нем тренда (тенденции развития ряда) возможна несколькими способами (метод средних, Фостера и Стюарта, Валлиса и Мура и пр.), но наиболее простым является графическая модель, где на графике по оси абсцисс откладывается время, а по оси ординат – уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. Тренд может представлять собой прямую линию, параболу, гиперболу и т.п. В итоге приходим к трендовой модели вида:
, (45)
где
–
математическая функция развития;
–
случайное или циклическое отклонение
от функции; t
– время в виде номера периода (уровня
ряда). Цель такого метода – выбор
теоретической зависимости
в качестве одной из функций:
–
прямая
линия;
– гипербола;
–
парабола;
–
степенная;
– ряд Фурье.
Для выявления тренда (тенденции развития ряда) в нашей задаче построим график Y(t) (рис.5):
Рис.5. График динамики среднегодовой численности занятых в экономике с 2006 -2011гг.
Из данного графика видно, что есть все основания принять уравнение тренда в виде линейной функции.
Определение
параметров
в этих функциях может вестись несколькими
способами, но самые незначительные
отклонения аналитических (теоретических)
уровней (
– читается как «игрек, выровненный по
t»)
от фактических (
)
дает метод
наименьших квадратов – МНК.
При этом методе учитываются все
эмпирические уровни и должна обеспечиваться
минимальная сумма квадратов отклонений
эмпирических значений уровней
от теоретических уровней
:
. (46)
В
нашей задаче при выравнивании по прямой
вида
параметры
и
отыскиваются
по МНК следующим образом. В формуле (45)
вместо
записываем его конкретное выражение
.
Тогда
.
Дальнейшее решение сводится к задаче
на экстремум, т.е. к определению того,
при каком значении
и
функция двух переменных S
может достигнуть минимума. Как известно,
для этого надо найти частные производные
S
по
и
,
приравнять их к нулю и после элементарных
преобразований решить систему двух
уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений:
(47)
где n – количество уровней ряда; t – порядковый номер в условном обозначении периода или момента времени; y – уровни эмпирического ряда.
Эта
система и, соответственно, расчет
параметров
и
упрощаются, если отсчет времени ведется
от середины ряда. Например, при нечетном
числе уровней серединная точка (год,
месяц) принимается за нуль. Тогда
предшествующие периоды обозначаются
соответственно –1, –2, –3 и т.д., а следующие
за средним (центральным) – соответственно
1, 2, 3 и т.д. При четном
числе уровней два серединных момента
(периода) времени обозначают –1 и +1, а
все последующие и предыдущие,
соответственно, через два интервала:
,
,
и т.д.
При
таком порядке отсчета времени (от
середины ряда)
=
0, поэтому, система нормальных уравнений
упрощается до следующих двух уравнений,
каждое из которых решается самостоятельно:
(48)
Как
видим, при такой нумерации периодов
параметр
представляет собой средний уровень
ряда. Определим
по формуле (48) параметры уравнения
прямой, для чего исходные данные и все
расчеты необходимых сумм представим в
таблице 3.3.
Таблица 3.3
. Вспомогательные расчеты для решения задачи
Год |
y |
t |
t2 |
yt |
|
(y
– |
( |
(y
–
|
2006 |
68327 |
-3 |
9 |
-204981 |
67845,702 |
231647,398 |
138320280,930 |
127230880,111 |
2007 |
74710 |
-2 |
4 |
-149420 |
71766,024 |
8666995,810 |
61475680,413 |
23977344,444 |
2008 |
75359 |
-1 |
1 |
-75359 |
75686,345 |
107154,905 |
15368920,103 |
18042672,111 |
2009 |
75898 |
1 |
1 |
75898 |
83526,988 |
58201459,357 |
15368920,103 |
13754208,444 |
2010 |
86407 |
2 |
4 |
172814 |
87447,310 |
1082243,905 |
61475680,413 |
46244533,444 |
2011 |
96939 |
3 |
9 |
290817 |
91367,631 |
31040153,065 |
138320280,930 |
300409778,778 |
Итого |
477640 |
0 |
28 |
109769 |
477640 |
99329654,440 |
430329762,893 |
529659417,333 |
Из
таблицы получаем, что
= 477640/6 = 79606,667 и
= 109769/28 = 3920,321. Отсюда искомое уравнение
тренда
=79606,667+3920,321t.
В 6-м столбце таблицы 3.3
приведены трендовые уровни, рассчитанные
по этому уравнению. Для иллюстрации
построим график эмпирических и трендовых
уровней (рис.6).
Рис.6. График эмпирических и трендовых уровней среднегодовой численности занятых в экономике
По
полученной модели для каждого периода
(каждой даты) определяются теоретические
уровни тренда ()
и оценивается надежность
(адекватность) выбранной модели тренда.
Оценку надежности проводят с помощью
критерия Фишера, сравнивая его расчетное
значение Fр
с теоретическими значениями FТ.
При этом расчетный критерий Фишера
определяется по формуле:
, (2)
где k – число параметров (членов) выбранного уравнения тренда; ДА – аналитическая дисперсия, определяемая по формуле (51); До – остаточная дисперсия (52), определяемая как разность фактической дисперсии ДФ (50) и аналитической дисперсии:
; (50)
; (51)
. (52)
Сравнение
расчетного и теоретического значений
критерия Фишера ведется обычно при
уровне значимости
с учетом степеней свободы
и
.
Уровень значимости
связан с вероятностью
следующей
формулой
.
При условии Fр
>
FТ
считается,
что выбранная математическая модель
ряда динамики адекватно отражает
обнаруженный в нем тренд.
Проверим
тренд в нашей задаче на адекватность
по формуле (2), для чего в 7-м столбце
таблицы 6 рассчитан числитель остаточной
дисперсии, а в 8-м столбце – числитель
аналитической дисперсии. В формуле (2)
можно использовать их числители, так
как оба они делятся на число уровней n
(n
сократятся): FР
=
430329762,893*5/(529659417,333*1) = 4,062 <
FТ,
значит, модель неадекватна и ее нельзя
использовать для прогнозирования (FТ=
6,61 находим по таблице значений F-критерия
Фишера при уровне значимости 0,05 [=
k
– 1 = 1]
и [
=
n
– k
= 4]).