
2к4с Математическая статистика и прогнозирование / МУ к практической работе 5
.pdfМинистерство образования и науки Российской Федерации Саратовский государственный технический университет Балаковский институт техники, технологии и управления
ПОСТРОЕНИЕ И АНАЛИЗ ТРЕНДОВОЙ МОДЕЛИ
Методические указания к выполнению практической работы по курсу «Математическая статистика и прогнозирование» для студентов всех форм обучения по направлению
«Информационные системы и технологии»
Одобрено
редакционно-издательским советом
Балаковского института техники,
технологии и управления
Балаково 2015
ВВЕДЕНИЕ Цель работы: научиться строить модель временного ряда с
использованием MS Excel.
ОСНОВНЫЕ ПОНЯТИЯ
Временным рядом (рядом динамики, динамическим рядом)
называется упорядоченная во времени последовательность численных показателей{(yi,ti), i=1,2,...,n}, характеризующих уровни развития изучаемого явления в последовательные моменты или периоды времени.
Величины yi называются уровнями ряда, а ti – временными метками
(моменты или интервалы наблюдения). Обычно рассматриваются временные ряды с равными интервалами между наблюдениями, в качестве значений ti
берутся порядковые номера наблюдений и временной ряд представляется в
виде последовательности |
, |
, … , , где n – количество наблюдений. |
|||
1 |
2 |
|
|
|
|
Целью исследования |
временного |
ряда |
является |
выявление |
закономерностей в изменении уровней ряда и построении его модели в целях прогнозирования и исследования взаимосвязей между явлениями.
Моделирование тенденции временного ряда начинается с проверки
наличия тенденции. Для этого наиболее широко применяются |
метод |
||||||||
сравнения средних и метод Фостера-Стюарта. |
|
|
|
|
|||||
Для получения ряда с меньшим разбросом уровней, что в ряде случаев |
|||||||||
позволяет |
на |
основе |
визуального |
анализа сделать вывод о наличии |
|||||
тенденции, применяется сглаживание временного ряда. |
|
|
|||||||
Сглаживание временного ряда по методу скользящей средней |
|||||||||
заключается |
в замене исходных уровней ряда yt сглаженными значениями |
||||||||
y′t, которые получаются как |
среднее значение |
определенного |
числа |
||||||
уровней |
исходного |
ряда, |
симметрично |
окружающих |
значение |
yt. В |
|||
результате |
получается |
временной |
ряд |
y′t, |
меньше |
подверженный |
|||
колебаниям. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
Для вычисления сглаженных |
значений |
y′t |
по |
методу простой |
||||||||
скользящей средней используются следующие формулы: |
|
|||||||||||
1) Нечетный интервал сглаживания g = 2p+1 (интервал сглаживания – |
||||||||||||
количество исходных уровней ряда (yt), используемых для сглаживания): |
||||||||||||
|
∑ + |
|
|
|
|
− |
+ |
− +1 |
+ + |
+−1 |
+ |
|
′ = |
= − |
|
= |
|
|
|
+ |
(1) |
||||
|
|
|
|
|
|
|
|
|
|
|||
|
2 +1 |
|
|
|
|
|
2 +1 |
|
|
|
||
|
|
|
|
|
|
|
|
|
где уt – фактическое значение уровня исходного ряда в момент t; y′t –
значение скользящей средней в момент t; 2р+1- длина интервала сглаживания. Формула (1) при интервалах сглаживания g = 3 и g = 5
принимает вид
′ = |
|
+ |
+ |
′ |
|
|
|
+ |
+ |
+ |
+ |
|
−1 |
|
+1 ; |
|
= −2 |
−1 |
|
+1 |
+2 |
||||
|
|
3 |
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2) Четный интервал сглаживания g = 2p:
|
1 |
|
+∑ +−1 |
|
+ |
1 |
|
|
1 |
|
+ |
+ + |
+ |
1 |
|
|
|
|
|
|
|
|
|
||||||||||
′ = 2 |
− |
= − +1 |
|
2 |
+ |
= 2 |
− |
− +1 |
+ −1 |
2 |
+ |
(2) |
||||
|
|
|
|
|
|
|
|
|||||||||
|
|
2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Формула (2) при интервалах сглаживания g = 2 и g = 4 принимает вид
1 |
|
+ + |
1 |
|
|
1 |
|
+ |
+ + |
+ |
1 |
|
||||
′ = 2 |
−1 |
|
2 |
+1 ; ′ |
|
= 2 |
−2 |
−1 |
|
+1 |
|
2 |
+2 |
|||
|
|
|
2 |
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При использовании скользящей средней с длиной активного участка g =
2p+1 первые и последние р уровней ряда сгладить нельзя, их значения теряются. Для восстановления потерянных значений временного ряда можно использовать следующий прием:
а) Вычисляется средний прирост ∆у на последнем активном участке
( |
, … , |
) |
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
∆ = |
|
− |
, |
|
|
|
− 1 |
|||
|
|
|
|
|
||
где g – длина активного участка. |
|
|
||||
б) Определяются значения последних |
р=(g–1)/2 уровней сглаженного |
|||||
временного |
ряда с помощью последовательного прибавления среднего |
|||||
абсолютного прироста ∆у |
к последнему сглаженному значению y′n–p |
|||||
′− +1 |
= ′− + ∆ , |
′− +2 = ′− +1 + ∆ , … , ′ = ′−1+∆ . |
||||
|
|
|
3 |
|
Аналогичная процедура применяется для восстановления первых р уровней временного ряда.
Аналитическим выравниванием временного ряда называют нахождение аналитической функции ŷ = f(t), характеризующей основную тенденцию изменения уровней ряда с течением времени. Сама функция f(t)
носит название кривой роста.
Чаще всего в качестве кривой роста применяются следующие функции:
линейная = 0 + 1 ;
парабола второго и более высоких порядков
= 0 + 1 + 2 2 + + ;
|
гиперболическая |
= |
0 |
+ |
1 |
; |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
экспонента = 0+ 1 ;
|
показательная |
= |
0 |
× |
; |
|
|
|
1 |
|
степенная = 0 × 1 .
Построение таких функций аналогично построению уравнений парной регрессии (линейной или нелинейной) с учетом того, что в качестве зависимой переменной используются фактические уровни временного ряда yt, а в качестве независимой переменной моменты времени t = 1,2, ..., n.
При анализе временных рядов наиболее часто в качестве трендовых моделей используются полиномы различных степеней, экспоненты и ряд других функций. Тем не менее моделирование временных рядов с помощью перечисленных функций не всегда дает удовлетворительные результаты, так как во временных рядах содержатся заметные периодические колебания вокруг общей тенденции или наблюдается автокорреляция не в самих уровнях, а в их отклонениях от полученных по определенным аналитическим формулам теоретических значений. В таких случаях следует использовать метод гармонического анализа ряда. Сущность метода состоит в представлении функций в виде суммы гармонических колебаний.
Применительно к временным рядам целью данного анализа является
4

выявление и измерение периодических колебаний во временных рядах и автокорреляции в остатках ряда.
Классический гармонический анализ заключается в разложении периодических функций в сходящийся ряд Фурье. Практическое проведение гармонического анализа связано с вычислением коэффициентов Фурье.
Аппроксимация динамики экономических явлений рядом Фурье состоит в выборе таких гармонических колебаний, наложение которых друг на друга
(сумма) отражало бы периодические колебания фактических уровней временного ряда. С помощью ряда Фурье можно представить динамику явлений в виде некоторой функции времени, в которой слагаемые расположены по убыванию периодов:
̂ = 0 + ∑( + )
В этом уравнении величина к определяет гармонику ряда Фурье и может быть взята целым числом (чаще всего от 1 до 4). Параметры уравнения определяются на основе метода наименьших квадратов и вычисляются по формулам:
10 = ∑
2= ∑
2= ∑
Исчисление параметров ряда Фурье может производиться и другими способами, в частности с помощью так называемого преобразования Фурье,
которое применимо как к периодическим, так и непериодическим функциям.
Преобразование Фурье рассматривается в статистике обычно в рамках
одномерного спектрального анализа, который является обобщенным случаем гармонического анализа. Теория спектрального анализа особенно широкое применение нашла в радиотехнических областях, где аппарат преобразования Фурье используется для преобразования сигналов или их
5
корреляционных функций из временной области в частотную. Цель такого преобразования — решение задач фильтрации и прогнозирования с меньшим объемом математических вычислений.
При статистическом исследовании экономических процессов следует иметь в виду, что исходные данные имеют дискретный характер и могут быть представлены одним из двух вариантов:
•ограниченным дискретным набором данных, называемым в терминах спектрального анализа случайной последовательностью (реализацией);
•корреляционной функцией, описывающей дискретный экономический процесс.
Использование корреляционной функции возможно только при достаточно большом времени наблюдения, когда на основании существующей выборки данных обоснована стационарность этого процесса,
т. е. неизменность во времени математического ожидания и дисперсии.
Из теории спектрального анализа для преобразования вышеназванных двух вариантов представления экономических процессов из временной в частотную область целесообразно заимствовать два понятия: спектр - для реализации случайной последовательности и спектральную плотность — для корреляционной функции случайного процесса.
Спектр — результат преобразования Фурье из временной области в частотную область конкретной реализации дискретного процесса (случайной последовательности).
Спектральная плотность — результат преобразования Фурье из временной области в частотную область корреляционной функции стационарного случайного процесса.
Спектральное разложение случайной функции y(t) в действительной форме определяется выражением
∞
( ) = ∑( + )
=0
где аk, bk - амплитуды для k-й гармоники;
6
— частота к-й гармоники.
Придадим спектральному разложению функции y(t) в действительной форме комплексную форму. Комплексная форма записи удобна, в частности,
потому, что всевозможные линейные операции над функциями, имеющими вид гармонических колебаний (дифференцирование, интегрирование,
решение линейных дифференциальных уравнений и т д.), осуществляются гораздо проще, когда эти гармонические колебания записаны не в виде синусов и косинусов, а в комплексной форме, в виде экспоненциальной функции. Для этого используем формулы Эйлера
|
|
|
|
|
|
|
+ |
− |
||
|
= |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− |
− |
|
|
|
|
= |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
подставляя которые в формулу разложения функции y(t) в
действительной форме и осуществляя последующие преобразования,
получаем итоговую формулу разложения функции y(t) в комплексной форме:
∞
( ) = ∑ Ф
=−∞
При статистическом исследовании экономических процессов появляются достаточно серьезные ограничения, которые требуют привлечения математического аппарата, несколько отличного от того,
который был рассмотрен для случайной функции y(t).
Во-первых, исходные данные дискретны, а значит, оперировать нужно не случайными функциями, а случайными последовательностями y(n) (n=T/N, где T - период дискретизации случайной последовательности).
Во-вторых, набор исходных данных характеризуется ограниченным объемом, а это значит, что, используя терминологию спектрального анализа,
следует оперировать случайными последовательностями у(п) конечной длины N.
7
Для таких последовательностей вводится понятие дискретного обратного преобразования Фурье в виде суммы спектральных составляющих:
−1
2
( ) = ∑ ( )
=0
где Y(к) — комплексные числа из частотной области, соответствующие амплитудам k-й гармоники;
N — общее число наблюдений;
п - номер текущей точки.
Дискретное прямое преобразование Фурье позволяет вместо последовательности у(п) из временной области получить комплексные числа
Y(k) в частотной области:
−1
2
( ) = ∑ ( )
=0
Для уменьшения времени вычисления преобразования Фурье разработан алгоритм, получивший название быстрого преобразования Фурье. Это преобразование реализовано в Microsoft Excel.
ТРЕБОВАНИЯ БЕЗОПАСНОСТИ ТРУДА
При выполнении практической работы необходимо соблюдать общие правила техники безопасности:
использовать ПК только в соответствии с их назначением;
не размещать на корпусе ПК посторонние предметы (тетради, книги,
карандаши и т.п.);
оберегать ПК от толчков, ударов, сотрясений;
немедленно поставить в известность оператора ИВЦ об обнаружении задымления, загорания, пожара;
немедленно сообщить оператору ИВЦ обо всех неисправностях в работе ПК.
8
ТЕХНОЛОГИЯ ВЫПОЛНЕНИЯ РАБОТЫ
Задача 1
На основе приведенных в таблице 1 данных о производстве продукции:
1.Проведите сглаживание уровней ряда с помощью трехчленной скользящей средней.
2.Проведите аналитическое выравнивание и выразите общую тенденцию роста каждого вида продукции соответствующими математическими уровнями, определите выравнивание уровня ряда динамики и нанесите их на график с фактическими данными.
3.По построенному тренду сделайте прогноз по выпуску продукции на
2013 год.
Таблица 1
годы |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
Производство |
|
|
|
|
|
|
|
|
|
|
продукции, |
736,3 |
762,2 |
772,6 |
827,6 |
851,1 |
848,3 |
853,5 |
834,5 |
891,7 |
933,0 |
млн.руб. |
|
|
|
|
|
|
|
|
|
|
1)Проведем сглаживание уровней ряда динамики с помощью трехчленной скользящей средней:
y* |
y0 y1 |
y2 |
|
|
|
736,3 762,2 772,6 |
|
757,03 |
|||
|
|
|
|||||||||
1 |
|
3 |
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
y2* |
y1 y2 |
y3 |
|
|
|
|
762,2 772,6 827,6 |
787,47 |
|||
3 |
|
|
3 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||
y3* |
|
y2 y3 |
y4 |
|
|
|
772,6 827,6 851,1 |
817,1 |
|||
|
3 |
|
|
3 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||
y4* |
y3 y4 |
y5 |
|
|
|
827,6 851,1 848,3 |
842,33 |
||||
3 |
|
|
3 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||
y5* |
y4 y5 |
y6 |
|
|
|
851,1 848,3 853,5 |
850,97 |
||||
3 |
|
|
|
3 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||
y6* |
y5 y6 |
y7 |
|
|
|
848,3 853,5 834,5 |
845,43 |
||||
3 |
|
|
|
3 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||
y7* |
y6 y7 |
y8 |
|
|
|
853,5 834,5 891,7 |
859,9 |
||||
3 |
|
|
|
3 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
9 |

y* |
y7 y8 y9 |
|
834,5 891,7 933,0 |
886,4 |
|
|
|||
8 |
3 |
3 |
|
|
|
|
2) Проведем аналитическое выравнивание. Найдем уравнение линейной
зависимости: |
|
yt |
a0 a1 t . Коэффициенты прямой определяются методом |
|||
наименьших |
|
квадратов |
из решения системы нормальных уравнений: |
|||
|
a0 n a1 t y |
, где t |
обозначает время. |
|||
|
t a1 t |
2 |
|
ty |
||
a0 |
|
|
|
Прежде, чем решать систему нормальных уравнений, проведем масштабирование временных моментов следующим образом (таблица 2):
Таблица 2
годы |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
t |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
В этом случае система примет более простой вид: |
a |
|
|
y |
, a |
ty |
. |
0 |
|
t 2 |
|||||
|
|
|
n |
1 |
|
Подставив в эти выражения масштабированные значения времени и уровни ряда, получим:
a0 736,3 762,2 772,6 827,6 851,1 848,3 853,5 834,5 891,7 933 831,1, 10
a1 4 736,3 3 762,2 2 772,6 1 827,6 0 851,1 1 848,3 2 853,5 3 834,5 ( 4)2 ( 3)2 ( 2)2 ( 1)2 02 12 22 32 42 52
4 891,7 5 933 - 2286,6- 2945,2-1545,2- 827,6 0 848,3 1707 2503,5 3566,8 4665 16 9 4 1 0 1 4 9 16 25
568685 67
Таким образом, тенденция имеет вид yt 831,1 67t .
Определим выровненные уровни ряда (таблица 3):
|
|
|
|
|
|
|
|
|
|
Таблица 3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
годы |
2003 |
2004 |
2005 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
yt |
563,1 |
630,1 |
697,1 |
764,1 |
831,1 |
898,1 |
965,1 |
1032,1 |
1099,1 |
1166,1 |
|
Строим график с фактическими данными и выровненными значениями
10