Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
информатика и математическая статистика.doc
Скачиваний:
6
Добавлен:
01.07.2025
Размер:
5.71 Mб
Скачать

10.4. Задания для самостоятельной работы.

Применить метод главных компонент к следующим данным по группе: рост, вес, длина правой руки, длина левой руки.

Тема №11. Экстраполяционный метод прогнозирования (одномерный случай). Прогнозирование состояния.

В исходном процессе выделяют детерминированную составляющую (тренд). Выделяются колебания длительной цикличности, существуют более краткие колебания – сезонные (в течение года).

Рис.11.1

Чтобы правильно вести прогноз, нужно выделить тренд (полином невысокого порядка). Длительную циклическую составляющую будем относить к тренду из-за нехватки данных. Выделяем сезонную составляющую – из исходного процесса вычитаем тренд.

S(t)

Рис.11.2. График сезонной составляющей.

Сезонная составляющая S(t), как правило, сопровождается помехами. Сезонная составляющая нестабильна.

11.1. Метод аппроксимации

Производственный процесс представлен графически

Рис.11.3. График производственного процесса.

y[N+k] - ?

Разложим процесс в ряд:

,

где y[n] – отсчеты;

- некоторая система функций, по которой ведём разложение (для тренда это полиномы);

- погрешность измерения (типа «белого шума»);

bi – искомые коэффициенты.

Модель производственного процесса (аппроксимация) можно представить в виде:

.

- такие значения, чтобы модель yA[n] была близка к y[n]. Как правило, применяется квадратичный критерий близости.

Квадратичный критерий имеет вид:

,

здесь подбирается критерий ,

R[n] – вес, который мы придаём результатам измерения.

Скользящее стробирование:

Рис.11.4. Скользящее стробирование.

Экспоненциальное сглаживание (самый распространенный метод):

Рис.11.5. Экспоненциальное сглаживание.

Общий случай:

Рис.11.6. Сглаживание функции.

Планирование прогноза – это подбор весовой функции R[n]. Наибольшее распространение получило экспоненциальное сглаживание.

Представим исходный процесс y[n] в матричном виде:

,

- помеха типа «белого шума» (ошибки между собой не связаны).

Это же уравнение можно записать в индексной форме:

;

;

;

условие минимуму этого критерия:

.

Элементы матрицы А:

,

в индексной форме:

.

Уравнение через элементы матриц:

.

Матрица z:

;

;

11.2. Мнемоническое правило вывода решения

Исходный процесс имеет вид:

,

необходимо найти оценки .

Домножим уравнение справа и слева на R[n] для того, чтобы взвесить y

.

Умножим уравнение на :

.

Это уравнение будет справедливо при любом n.

Подставим в уравнение следующие значения n:

  1. n=n0;

  2. n=n+1;

  3. n=N.

Просуммируем все левые части уравнений:

;

в результате получим:

.

Пример

Имеется производственный процесс.

Надо его спрогнозировать.

y[3+k] - ?

Рис.11.7

Несколько последних отсчетов оставляют, их не прогнозируют. Прогноз осуществляют на основе предыдущих отсчетов.

1. Модель (аппроксимация) производственного процесса:

.

Вес всем значениям даем единичный:

R[n]=1, .

;

;

; .

2. R[4]=0,1(3-n).

Применим экспоненциальное сглаживание:

;

;

;

уA[4] = 2,9.

Берём новый полином: ;

, .

3. .

; ;

; .

, определитель матрицы равен: D=56-36 = 20;

.

; .

; ;

;

методом аппроксимации получаем:

;

;

.

Тема №12.

Многомерная кластеризация при построении регрессионных моделей. Формирование информативных параметров.

Предположим, что рассматриваемая совокупность случайной величины Х неоднородна (рис. 12.1) и в нее входят, например, три группы совокупностей случайной величины с существенно различными параметрами распределений (математическим ожиданием и средним квадратическим отклонением).

Рис. 12.1. Кластеризация однородных групп

Истинные зависимости y=y(x) для этих групп совокупности показаны на рис. 12.1. Там же пунктиром показана линия регрессии y на x, построенная для совокупности всех групп. Таким образом, обработка неоднородной совокупности теми же методами, какие применимы для однородных, могут привести к серьезным ошибкам.