1 Проверка стационарности случайных процессов
1.1 Цель работы
Изучить статистические критерии случайности. Научиться применять критерии стационарности случайных процессов к данным, представленными временными реализациями.
1.2 Основные теоретические сведения
1.2.1Проверка стационарности процесса с помощью применения статистических критериев случайности.
Случайный процесс называется стационарным в узком смысле, если егоn–мерные законы распределения не изменяются при сдвиге всех его временных аргументов на одинаковую произвольную величину:
.
Случайный процесс называется стационарным в широком смысле, если его математическое ожидание постоянно (), а корреляционная функция есть функция сдвига между аргументами:
.
При проверке стационарности процесса по его реализации необходимо сделать существенные допущения:
Любая реализация правильно отражает стационарный (или не стационарный) характер процесса. Это допущение вполне приемлемо для нестационарных процессов с детерминированным трендом.
Длина реализации должна быть существенно больше периода самой низкочастотной составляющей процесса.
Удобно предположить, что любые, представляющие интерес нестационарные свойства процесса полностью описывают медленные изменения во времени среднего квадрата процесса.
Имея в виду данные допущения, можно предложить следующую последовательность действий для проверки стационарности случайного процесса по его реализации .
1) Реализация разделяется на Mравных интервалов, причем наблюдения в различных интервалах полагаются независимыми.
2) Вычисляются оценки среднего квадрата (или отдельно средних значений и дисперсий) для каждого интервала:
, , …
3) Полученная последовательность проверяется на наличие тренда или других изменений во времени, которые не могут быть объяснены только выборочной изменчивостью оценок с помощью статистических критериев случайности.
Критерий серий
Рассмотрим последовательность из N наблюденных значений случайной величины, причем каждое наблюдение отнесем к одному из двух взаимно исключающих классов («+» и «–»), при этом разбиение можно проводить относительно математического ожидания, медианы и других характеристик. Серией называется последовательность однотипных наблюдений, перед и после которой следуют наблюдения противоположного типа (или вообще никаких).
Число серий S, появившееся в последовательности наблюдений, позволяет выяснить, являются ли отдельные результаты независимыми наблюдениями или временной ряд имеет тренд. Если последовательность из N наблюдений состоит из независимых исходов одной и той же случайной величины, то число серий в последовательности является случайной величинойс математическим ожиданием и дисперсией:
,
,
где N1 – число исходов «+», N2 – число исходов «–».
Всегда можно провести разбиение на классы, так чтобы N1=N2=N/2, например, путем сравнения наблюдений с медианой выборки. Тогда значения математического ожидания и дисперсиипринимают вид:
,
.
Число серий, появившееся в последовательности наблюдений, будет иметь выборочное распределение, протабулированное в табл. А.1. Поэтому далее необходимо проверить гипотезу о том, что данные являются независимыми или же присутствует тренд.
В качестве гипотезы принимаем, что наблюдения являются независимыми исходами одной и той же случайной величины (временной ряд не содержит тренда). Для проверки гипотезы с требуемым уровнем значимости надо сравнить наблюденное значение числасерий с границами области принятия гипотезыи. Если
то гипотезу принимаем с уровнем значимости . В противном случае гипотезу отвергаем,что свидетельствует о наличии тренда в данных.
Критерий инверсий
Рассмотрим последовательность из N наблюдений. Подсчитаем, сколько раз в последовательности имеют место неравенства при. Каждое такое неравенство называется инверсией. Пусть А – общее число инверсий.
Если последовательность из N наблюдений состоит из независимых исходов одной и той же случайной величины, то число инверсий является случайной величиной с математическим ожиданием и дисперсией:
,
.
Число инверсий, появившееся в последовательности наблюдений, будет иметь выборочное распределение, протабулированное в табл. А.2. В качестве гипотезы принимаем, что наблюдения являются независимыми исходами одной и той же случайной величины (временной ряд не содержит тренда). Для проверки гипотезы с требуемым уровнем значимости надо сравнить наблюденное значение числаинверсий с границами области принятия гипотезыи. Если
то гипотезу принимаем с уровнем значимости . В противном случае гипотезу отвергаем.
Критерий инверсий считается более мощным при обнаружении монотонного тренда. Однако он не столь эффективен при выявлении тренда типа флуктуаций. Если , то это указывает на наличие возрастающего тренда;– падающего тренда.
Критерий поворотных точек.
Рассмотрим последовательность из N наблюдений. Подсчитаем количество пиков и впадин, т.е. сколько раз в последовательности имеют место неравенства или. Каждое такое неравенство определяет поворотную точку. Пусть Р – общее число поворотных точек.
Если последовательность из N наблюдений состоит из независимых исходов одной и той же случайной величины, то число поворотных точек является случайной величиной с математическим ожиданием и дисперсией:
,
.
Число поворотных точек, появившееся в последовательности наблюдений, стремится к нормальному распределению . В качестве гипотезы принимаем, что наблюдения являются независимыми исходами одной и той же случайной величины (временной ряд не содержит тренда). Для проверки гипотезы с требуемым уровнем значимостинадо сравнить наблюденное значение числа поворотных точек с границами области принятия гипотезы, где,-интеграл Лапласа. Если число серий окажется вне этой области, то гипотеза отвергается. В противоположном случае гипотезу можно принять с уровнем значимости.