Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shp.docx
Скачиваний:
93
Добавлен:
27.09.2019
Размер:
807.77 Кб
Скачать

42. Date Mining. Прогнозирование.

Data mining – это процесс выделения их данных неявной объективной и практически полезной информации и представление ее в виде, пригодном для использования.

выделяют 5 стандартных типов закономерностей, которые позволяют выявить методы Data Mining:

1) ассоциация

2) классификация

3) кластеризация

4) Последовательность

5) прогнозирование

Прогнозирование направлено на определение динамики конкретного объекта или события на основе ретроспективных данных, т.е. анализа его состояний в прошлом и настоящем.

Для решения задач прогнозирования обязательной и необходимой является обучающая выборка, которая также называется временным рядом.

Временной ряд – последовательность наблюдаемых значений какого-либо признака, упорядоченног в неслучайные моменты времени.

Отличием временного ряда от случайной выборки является предположение о равных промежутках времени мужду наблюдениями и их хронологический порядок.

Анализ временного ряда осуществляется с целью:

1) определение природы ряда

2) прогнозирование будущих значений

В процессе определения структуры и закономерностей временного ряда предполагается обнаружение шумов и выбросов, тренда, сезонной компоненты, циклической компоненты.

Тренд является систематической компонентой временного ряда, отражающей изменение значений ряда во времени.

Тренды бывают сезонными и несезонными.

Сезонный тренд – периодически повторяющиеся значения через примерно равные промежутки времени.

Процесс прогнозирования:

Перед началом прогнозирования необходимо ответить на след. вопросы:

1) что нужно прогнозировать

2) в каких временных параметрах

3) с какой точностью

В 1) нужно определить те параметры, которые будут прогнозироваться, их значения и колебания этих значений.

Второй этап- определение периода прогнозирования, горизонта прогнозирования и интервала.

Период отвечает на вопрос, на сколько делается прогноз.

Горизонт – число периодов, на которые делается прогноз.

интервал – частота, с которой делается прогноз.

Краткосрочный прогноз – прогноз на несколько шагов, не > 3% от длины выборки

Среднесрочный прогноз – 7 -12 шагов или 5-7% выборки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]