Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР2.doc
Скачиваний:
3
Добавлен:
08.11.2019
Размер:
1.09 Mб
Скачать

2.3 Исследование данных на нормальность

Особый интерес представляет важное непрерывное распределение, называемое нормальным, поскольку многие широко используемые величины могут быть им аппроксимированы. Для определения конкретного нормального распределения необходимо знание среднего значения и среднеквадратического отклонения. Кривая нормального распределения является симметричной и имеет форму колокола (рис. 1)

Рис.1. График нормального распределения

Вероятность попадания значения нормальной случайной величины в некоторый интервал находится преобразованием этого интервала в единицы среднеквадратического отклонения. Это преобразование называется Z- стандартизацией. Z- стандарт любого значения Х – это число среднеквадратических отклонений от центрального значения кривой ( ) до этого значения (1).

, (1)

где Х – переменная;

- среднее значение;

- среднеквадратическое отклонение.

После того как выполнен процесс Z-стандартизации, таблица нормального распределения может быть заполнена посредством вычисления площади под кривой между центром кривой и интересующим значением Х.

2.4 Исследование данных с помощью автокорреляционного анализа

Если изменение величины наблюдается во времени, то часто наблюдения в различные промежутки времени оказываются взаимосвязанными, или коррелированными. Степень этой взаимосвязи измеряется при помощи коэффициента корреляции.

Автокорреляция – это корреляция между величиной и её запаздыванием в один или более периодов времени.

С помощью механизма автокорреляции могут изучаться наборы данных имеющих тренд и сезонность. Коэффициенты автокорреляции для различных значений запаздывания величин во времени используются для отождествления моделей поведения данных, присутствующих во временных рядах.

Если ряд случаен, то коэффициенты автокорреляции между Yt и Yt-k близки к нулю, т.е. последовательные значения временного ряда не связаны друг с другом.

Если у ряда существует тренд, значения Yt и Yt-k имеют сильную корреляцию, причём коэффициенты существенно отличны от нуля, для нескольких первых периодов запаздывания, а с увеличением периода постепенно убывают до нуля.

Если ряд имеет сезонную компоненту, значительный коэффициент автокорреляции будет наблюдаться для периодов, равных сезонному периоду или кратных ему.

Если ряд является случайным, практически все коэффициенты автокорреляции должны находиться внутри интервала, содержащего нуль, плюс или минус определённое количество число стандартных ошибок, т.е. при заданном уровне значимости ряд может считаться случайным, если вычисленные коэффициенты автокорреляции находятся внутри интервала, ограниченного выражением

2.5 Выбор метода прогнозирования и оценка его адекватности

При выборе оптимального метода прогнозирования для конкретной задачи предвари­тельно следует определить: чем обусловлена необходимость прогноза; конкретную сферу применения для результатов прогноза; период прогнозирования; требования к исходным данным; необходимую точность прогноза; стоимость прогноза.

Стационарные методы прогнозирования используются в следующих случаях: воздействия, порождающие ряд, стабилизировались, и окружающая среда, в которой ряд существует, относительно неизменна; в силу недостатка данных либо для упрощения объяснения или реализации прогноза не­обходимо использовать очень простую модель; стабильность может быть достигнута за счет простой корректировки таких факторов, как рост населения или инфляция; ряд можно преобразовать в стабильный; ряд представляет собой множество ошибок прогноза, полученных в результате применения метода прогнозирования, который может считаться неадекватным .

Методы прогнозирования, которые могут применяться по отношению к стационарным рядам, включают в себя наивные методы: методы простого усреднения, скользящие средние, простое экспоненциальное сглаживание и методы авторегрессионого скользящего среднего (методы Бокса-Дженкинса).

Методы прогнозирования для рядов, обладающих трендом, используются в следующих случаях: повышение производительности труда и применение новых технологий ведут к изменению стиля жизни; рост населения вызывает увеличение потребностей в товарах и услугах; покупательная способность валюты за счет инфляции оказывает влияние на общие экономические показатели; возрастает признание продукта на рынке

Аппарат прогнозирования, который должен использоваться для прогнозирования рядов, имеющих тренд, — это метод скользящих средних, метод линейного экспоненци­ального сглаживания Хольта (Holt), простая регрессия, возрастающие кривые, экспо­ненциальные модели и методы авторегрессионых интегрированных скользящих средних (методы Бокса—Дженкинса).

Методы прогнозирования для сезонных данных используются в следующих случаях: на изучаемую величину влияет погода; рассматриваемая величина определяется годичным циклом; .

Методы, которые следует использовать для прогнозирования сезонных рядов, вклю­чают классическое разложение, экспоненциальное сглаживание Вин­тера (Winter), многомерную регрессию временного ряда и методы Бокса-Дженкинса.

Методы прогнозирования для циклических данных используются в следующих случаях: на интересующую величину влияет бизнес-цикл; имеют место изменения в общественных вкусах; возникают изменения в народонаселении; происходят сдвиги в цикле производства продуктов потребления.

Аппарат, который необходимо использовать для прогнозирования циклических ря­дов, включает классическое разложение, экономические индикаторы, эконометрические модели, многомерную регрессию и методы Бокса-Дженкинса.

В итоге можно сделать следующие выводы:

1. Статистически сложные или комплексные методы прогнозирования действительно не приводят в обязательном порядке к получе­нию более точных прогнозов, чем более простые методы.

2. Разные показатели точности (MAD, MSE, МАРЕ), используемые для оценки различных методов прогнозирования, дают согласованные результаты.

3. Комбинирование результатов трех экспоненциальных сглаживающих методов превосходит, в среднем, отдельные комбинируемые методы и дает наилучший эффект в сравнении с другими методами.

4. Эффективность различных методов прогнозирования зависит от отдаленности прогноза во времени и типа (ежегодные, ежеквартальные, ежемесячные) анализи­руемых данных. Одни методы дают большую точность для короткого промежутка времени, в то время как другие больше подходят для составления длительных прогнозов. Некоторые методы хорошо работают с ежегодными данными, а другие более эффективны для ежеквартальных и ежемесячных данных.

По завершении исследования необходимо проверить, насколько каждый метод надежен и применим к рассматриваемой проблеме (табл.1).

Таблица 1. Рекомендации по выбору метода прогнозирования*

Метод

Модель данных

Временная отдаленность

Тип модели

Минимальные требования к данным

Несезонные

Сезонные

Наивный

ст, т, с

К

ВР

1

Простые средние

ст

К

ВР

30

Скользящие средние

ст

К

ВР

4-20

Экспоненциальное сглаживание

ст

к

ВР

2

Линейное экспоненциальное сглаживание

т

к

ВР

3

Квадратичное экспоненциальное сглаживание

т

к

ВР

4

Сезонное экспоненциальное сглаживание

с

к

ВР

2хс

Адаптивная фильтрация

с

к

ВР

5хс

Простая регрессия

т

с

к

10

Множественная регрессия

Ц, С

с

к

10хВ

Классическое разложение

с

к

ВР

5хс

Экспоненциальные трендовые модели

т

с,д

ВР

10

Подгонка 8-кривой

т

с,д

ВР

10

Модели Гомперца

т

с,д

ВР

10

Возрастающие кривые

т

с,д

ВР

10

"Перепись-11"

с

к

ВР

6хс

Модели Бокса-Дженкинса

ст, т, ц, с

к

ВР

24

3хс

Ведущие индикаторы

Ц

К

К

24

Эконометрические модели

ц

К

К

30

Многомерная регрессия временного ряда

Т, С

с,д

к

6хс

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]