Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МатметодыУП для Заочников (1).doc
Скачиваний:
48
Добавлен:
08.05.2019
Размер:
3.78 Mб
Скачать

Тренды на основе сплайн-функций

Если в результате анализа ряда не удаётся подобрать простой тип тренда для всего ряда, можно попытаться разбить ряд на части.

10(65)гладкость тренда - трудно при смене тенденции

сплайн - непрерывная [линейно] кусочная функция.

точки перелома x`

задание линейного сплайна по 1. Точкам перелома 2. Через алгоритм. Функцию

(последовательный учёт влияния) Wj=X-X`j-1, при X> X`j-1 (иначе - 0)

S=b0+Summ BjWj, где В - угловой коэфф. (изменение его в точке перегиба)

использование для анализа структуры динамики.

10(75)пример

Деление ряда на (3) части

Расчёт функций тренда - ... - они не состыкованы.

Стыкуем как среднее арифметическое ..

Задание тренда точками перелома - коррекция функций тренда (где b - средние)

Через алгоритм - коррекция B по новым а.

Скользящий тренд по базе m Y=SUM 1 n-m (Vj j+m)

Критерии случайности

(Выдержка из - Кендел М. Временные ряды. М.: Финансы и статистика, - 1981.)

Простейшей гипотезой, которую можно выдвинуть относи­тельно колеблющегося ряда, является предположение, что колебания случайны. Па практике бывает достаточно лишь посмотреть на данные, чтобы отбросить эту гипотезу, но в некоторых случаях необходимы более точные критерии, например при изучении остатков, полученных вычитанием из исходного ряда систематических элементов, когда требуется устано­вить, не осталось ли в них какой-либо систематизации.

В случайных рядах, согласно гипотезе, наблюдения незави­симы и могут следовать в любом порядке. Возможно применение неограниченного числа критериев случайности, но одни критерии по опре­деленным соображениям лучше, чем другие.

Желательно, чтобы критерий не требовал каких-либо ограничений на вид распределения совокупности, из которой, по предполо­жению, извлекаются наблюденные значения.

Необходимые вычисления должны быть сведены к минимуму,

Вычисления должны легко обновляться; другими словами, необходимо, чтобы не требовалось проводить все вычисления с самого начала, если после подсчета критерия с течением времени добавляются новые наблюдения.

Выбор критерия до некоторой степени зависит от того, какие выдвигаются альтернативные гипотезы. Работа Неймана и Пирса по проверке гипотез подтверждает, что никто не проверяет гипотезу саму по себе, а лишь в сравнении с другими возможными гипотезами. Не всегда легко точно определить, какие альтернативные гипотезы, целесообразно выдвинуть, но обычно имеются некоторые соображения, которые могут в значительной степени помочь при выборе критерия. Например, в случае, когда данные по виду как будто имеют тренд, требуется критерий, отличный от того, который используется при подозрении па периодичность.

Поворотные точки

Наиболее простой для применения критерий, особенно если ряд изображен графически, состоит в подсчете пиков и впадин. «Пик»— это величина, которая больше двух соседних. «Впадина», наоборот, - значение, которое меньше двух соседних, Оба эти значения на­зываются «поворотными точками» и нам предстоит рассмотреть во­прос: каково распределение числа поворотных точек в случайном ря­ду?

Рассмотрим конечный ряд из n величин . Началь­ное значение нельзя считать поворотной точкой, так как неизвест­но; и аналогично, нельзя рассматривать в качестве поворотной точ­ки последнее значение, так как неизвестно . Для определения поворотной точки требуются три последовательных значения. Если ряд случаен, то эти три значения могут следовать в любом из шести возможных порядков с равной вероятностью. Только в четырех из них будет поворотная точка, а именно когда наибольшее или наимень­шее из трех значений находится в середине. Следовательно, вероят­ность обнаружения поворотной точки в любой группе из трех значений равна 2/3.

Для группы из n величин определим «счетную» переменную вершин X как

Тогда число поворотных точек р в ряде есть просто , и сразу же получаем:

Это - ожидаемое число поворотных точек (другими словами, поворотная точка приходится примерно на каждые 1,5 наблюдения). Если их больше (редкий случай), то ряд является быстро колеблющимся, и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения положительно коррелированны. Од­нако для того, чтобы сделать вывод, существенна ли разница между наблюденным и ожидаемым числом, требуется знать дисперсию р. Можно показать, что с ростом n, распределение быстро приближается к нормальному с дисперсией

Длина фазы

Определенный интерес представляет не только число поворотных точек, но и распределение интервалов между ними. Интервал между двумя поворотными точками называется «фазой». Таким образом, если — впадина, a — пик, то между ними будет фаза длины 1.

Для того, чтобы установить наличие фазы длины d (скажем, восходящей), нужно обнаружить d + 3 членов, содержащих падение первого члена ко второму, затем последовательный подъем до (d+2)-го члена и падение к (d+3)-му члену. Рассмотрим такую группу из (d+3) значений в порядке их возрастания. Если, не трогая двух крайних членов, извлечь пару чисел из оставшихся d+1 и одно из них поставить в начало, а другое в конец, получим фазу длины d. Существует 1/2d(d+1) способов такого выбора пары чисел, и каждый член пары может быть поставлен в любой конец, следовательно, число восходящих фаз равно d(d+1). Кроме того, можно первый член поставить в конец, а любой другой, кроме второго, в начало и получить ещё (d+1) случаев. Можно также последний член поставить в начало, а любой другой, кроме предпоследнего, в конец, что даёт ещё (d+1) случаев. При этом надо исключить двойной счет случая, когда первый член становится на последнее место, а последний на первое. Всего существует

фаз случаев роста. Следовательно, вероятность либо восходящей, либо нисходящей фазы в группе чисел равна

В ряде длины n последовательно можно выделить n-d-2 групп по d+3 членов. Таким образом, математическое ожидание числа фаз длины d во всем ряде равно

а математическое ожидание общего числа фаз длины от 1 до n-3, которое обозначим через N, будет

Пример

В данных имеется 34 фазы. Фактическое число фаз различной длины и их теоретическое число, определяемое выражением для N, будет следующим:

Длина фазы

Число наблюдаемых фаз

Теоретическое число фаз

1

23

21,25

2

7

9,17

3

4

2,59

ИТОГО

34

33,01

Согласие хорошее, поэтому проверка существенности вряд ли необхо­дима.

Сравнение наблюденного и теоретического числа фаз с по­мощью критерия обычного вида неправомерно вследствие того фак­та, что длины фаз не являются независимыми. Уоллис и Мур пришли к выводу, что при разбиении длин фазы на три группы, d = 1, 2, >= 3, при значениях >= 6,3 может быть использован крите­рий с 2½ степенями свободы, а для более низких значений - критерий 6/7 с двумя степенями свободы.

Критерий, основанный на знаках разностей

Несколько более сложный критерий состоит в подсчете числа положительных разностей первого порядка в ряде, иначе говоря, чис­ла точек возрастания ряда. Для ряда из n членов получаем n — 1 раз­ностей. Как и прежде, определим «счетную переменную»:

Если теперь обозначить через с число точек возрастания случайного ряда, то:

Распределение довольно быстро стремится к нормальности. Можно показать, что дисперсия стремится к:

Очевидно, что критерий, основанный на знаках разностей, совершенно бесполезен для выявления ряда, описывающего колеба­тельное движение, в котором число точек возрастания всегда будет приблизительно равно ½n. В основном он рекомендуется для провер­ки наличия линейного тренда. С другой стороны, критерий, основан­ный на поворотных точках, плохо подходит для обнаружения тренда, так как наложение заметных случайных колебаний на умеренный тренд приводит примерно к тому же множеству поворотных точек, что и при отсутствии тренда. Более совершенным, но и более сложным критерием для обнаружения линейного тренда являются регрессия и про­верка значимости регрессионного коэффициента или использование коэффициента , описанного в следующем параграфе.

Критерии, основанные на ранговой корреляции

Идею сравнения соседних значений ряда можно развить до сравнения всех значений. Для данного ряда подсчитаем чис­ло случаев, в которых . Обозначим это число через Р. Всего для сравнения имеется ½ n(n-1) пар и математическое ожида­ние числа Р для случайного ряда равно ¼ n(n-1). Если Р превышает это число и превышение значимо, то это указывает на наличие возра­стающего тренда; Р, меньшее, чем это число, указывает на падающий тренд. В действительности, число Р связано простым соотношением с коэффициентом ранговой корреляции Кендэла :

Этот коэффициент может изменяться от -1 до +1. Его математиче­ское ожидание для случайного ряда равно нулю, а дисперсия

Сравнительный анализ критериев

Имеются и другие критерии, представляющие значительный теоретический интерес, но на практике они требуются редко.

Критерий для обнаружения линейного тренда требуется не часто, но когда он необходим, наилучшим критерием будет либо ли­нейная регрессия, либо коэффициент . Последний имеет преимущест­во, которое заключается в том, что он не требует машинных вычисле­ний и легко обновляется. Можно показать, что критерий, основанный на знаках разностей, как критерий на тренд, имеет в асимптотике нулевую относительную эффективность в сравнении с критериями на основе коэффициента регрессии или .

Если предполагается, что тренда нет, то подсчет поворотных точек как критерий проверки гипотезы о случайности при альтерна­тивной гипотезе о наличии систематических колебаний прост для применения и эффективен на практике. Но если поворотные точки появляются гроздьями, то более подходит фазовый критерий.

Фостером и Стьюартом рассмотрено распределение рекорд­ных значений в ряде. Рекордное значение — это значение, которое больше (или меньше), чем все предыдущие записанные значения. Как критерий гипотезы о тренде он менее эффективен, чем критерии на основе регрессионного коэффициента или . Главный недостаток, без­условно, состоит в том, что если в действительности нет сильного тренда, то с течением времени рекордные значения имеют тенденцию ста­новиться редкими.

Вначале отмечалось, что критерий для проверки ги­потезы о случайности может потребоваться для анализа остатков, полученных вычитанием из ряда систематических элементов. К сожа­лению, сам процесс вычитания обычно порождает корреляцию в по­лучаемых остатках, даже если исходные значения случайны. Именно поэтому довольно опасно применять рассмотренные критерии для ана­лиза остатков без исследования искажений, вносимых процессом вы­читания.

Ряд случайных колебаний дискретен по своей сути, но не­которые ряды непрерывного типа (острие лезвия бритвы под микроско­пом, звуковая дорожка движущейся пластинки) имеют весьма несис­тематический вид. Если изучать физические явления вплоть до уров­ня атомов, они, конечно, дискретные. Но остается вопрос, возможны ли математически непрерывные случайные ряды. По нашему мнению, от­вет должен быть отрицательным. Тем не менее, можно рассматривать ряд, в котором интервал наблюдения велик и охватывает большое чис­ло точек, в которых проявляется случайный эффект. Для некоторых целей такие ряды, подобные острию бритвы, можно рассматривать как непрерывные, но в математических доказательствах необходима осто­рожность. Осуществить предельный переход к континууму, как это де­лается в математике при построении арифметического континуума исходя из множества дискретных точек, не представляется возможным. Другими словами, не представляется возможным по­строить формально теорию непрерывного случайного ряда аналогично тому, как в математике строится теория вещественных чисел.

Все рассмотренные критерии, не зависят от вида распределения, за исключением стандартного критерия на основе регрессионного коэффициента, когда для определения линейного тренда строится регрессия переменной на время. Большинство рядов, встречающихся на практике, столь явно неслучайны, что тщательное обсуждение критериев случайности едва ли окупится. Однако в теории стационарных процессов часто точные результаты, связанные с распределениями, мо­гут быть получены только для случайных рядов, и эти результаты ис­пользуются в качестве полезной проверки неслучайных рядов по при­ближенным формулам.