Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

belyuchenko_i_s_smagin_a_v_i_dr_analiz_dannykh_i_matematiche

.pdf
Скачиваний:
24
Добавлен:
19.11.2019
Размер:
4.24 Mб
Скачать

 

37

 

d 2

 

rs

1

 

 

i

1 1,83 083.

n

2

n

 

i 1

 

 

 

 

 

 

 

Известно, что для n > 10 проверка нулевой гипотезы о коэффициенте ранговой корреляции Спирмена может быть осуществлена с помощью статистики:

(9.1)

имеющей, при справедливости нулевой гипотезы, распределение Стьюдента с (n – 2) степенями свободы.

В нашем случае

Для уровня значимости α = 0,01 и 35 степеней свободы табличное (теоретическое) значение равно 2,73, что по модулю меньше, чем полученное эмпирически (расчетное). Поэтому нулевая гипотеза отвергается, и мы должны сделать вывод о том, что приведенный ряд не представляет собой набор случайных значений и, вероятно, имеет тренд среднего.

Установив визуально, или с помощью расчетов, факт наличия тренда среднего, необходимо попытаться выделить его или исключить (элиминировать) шумовую компоненту. Для этого существуют различные методы, такие как подбор соответствующей функциональной зависимости, использование скользящих средних.

Наиболее эффективным методом описания тренда является подбор некоторого аналитического выражения, как правило, полинома невысокой степени. Такой подбор осу-

101

ществляется с использованием метода наименьших квадратов по правилам, описанным в одной из прошлых глав.

Для данных, представленных на рисунке 9.1 и в таблице

9.1, запишем уравнения тренда в виде:

y1 = а1 + b1x и y2 = a2 + b2x + cx2.

По методу наименьших квадратов имеем:

37 а1 + 1887 b1 = 3722

1887 а1+ 100455 b1 = 1919222

и

37а2 + 1887 b2 + 100455 c = 3722

887 а2 + 100455 b2+ 5553441 c = 191922

100455 а2 + 5553441 b2 + 317003190 c = 10319070

Решив эти системы уравнений, получим

а1 = 75,2; b1 = 0,5; b2 = – 1,82; с = 0,022.

Уравнения тренда примут вид:

y1 = 75,2 + 0,5x и у2 = 132,3 – 1,82x + 0,022x2.

9.4 Задача выбора наилучшего уравнения тренда

Коэффициент детерминации для модели у1 равен 0,48, а для модели у2 он равен 0,49, что говорит о том, что для описания тренда подходят оба уравнения. В этом можно убедиться, и если посчитать значения отклонений от опытных данных, вычисленных по этим уравнениям. Однако необходимо иметь точный количественный метод для строгой проверки того, какое из пары уравнений лучше подходит для описания тренда. Естественно, что лучшим является то уравнение, которое дает меньшую сумму квадратов отклонений от экспериментальных данных. Однако выбор в качестве уравнения тренда, например, полинома более высокого порядка будет оправдан только в том случае, если получаемое при его использовании уменьшение суммы квадратов

102

отклонений от опытных данных будет статистически значимо.

Иногда считают, что аналитическое описание тренда связано с некоторым «законом» развития изучаемого процесса в пространстве и во времени. Такой взгляд оправдан только в том случае, когда закон расценивается как не более чем проявление некоторой тенденции, а его аналитическое описание – просто как способ наглядного изображения изучаемого отрезка динамического ряда. Поэтому, как правило, представление о том, что уравнение тренда это нечто большее, чем просто описание эмпирических данных, не является очевидным.

Кроме того, следует иметь ввиду, что для одного и того же динамического ряда, могут быть подобраны самые разные уравнения тренда, одинаково хорошо соответствующие имеющимся данным. Поэтому выбор подходящей кривой должен осуществляться с использованием нестатистической информации о сущности исследуемого ряда, которая в некоторых случаях позволяет выбрать из множества возможных кривых для описания тренда какую-то одну. В противном случае, когда эта информация отсутствует, подбор уравнения тренда осуществляется по тем же правилам, которые мы рассматривали ранее, обсуждая вопросы построения функциональных зависимостей.

Может оказаться, что, подбирая аналитическое выражение для описания тренда, мы сталкиваемся с ситуацией, когда для приемлемого согласия с эмпирическими данными придется остановиться на такой зависимости, которая имеет сложный вид, например, полином очень высокой степени. Как правило, такая ситуация свидетельствует о том, что весь наблюдаемый ряд состоит из нескольких частей. Поэтому, используя априорную информацию и проведя визуальный анализ, необходимо определить эти части и уравнения тренда находить для каждой из них. Описание тренда должно

103

быть по возможности простым, т. е. включать в себя минимальное число параметров. В частности, при использовании полинома оно не должно быть, как правило, выше второго порядка. В этом случае есть надежда дать содержательную трактовку получаемым уравнениям. Естественно, что простота описания не должна идти в ущерб статистически значимому соответствию эмпирическим данным.

9.5Обнаружение колебательных составляющих динамического ряда

Обнаружение и выделение тренда является первым этапом при анализе динамических рядов. Описав его соответствующим регрессионным уравнением, находят величины yi для каждого момента времени или пространственной координаты по этому уравнению и вычитают их из исходных данных. После элиминирования тренда необходимо провести анализ колебательной компоненты и в последнюю очередь – случайной. Здесь мы сталкиваемся с задачей обнаружения взаимозависимости между значениями анализируемого ряда. Кстати, такая же задача стоит и при построении уравнений регрессии, когда проверка коррелированности остатков является необходимой для проверки адекватности выбранного уравнения и обоснованности использования метода наименьших квадратов для оценки параметров.

Наиболее распространенным критерием для проверки коррелированности является критерий Дарбина – Уотсона. Статистика критерия очень проста:

 

n

 

 

 

 

(ei

ei 1 ) 2

D

i 2

 

 

(9.2)

 

n

 

 

 

ei2

i 1

где еi – остаток yi yˆi , еi ei-1 – разность последовательных остатков.

104

После того, как убедятся в том, что вновь полученный ряд не является набором независимых случайных величин, определяют периоды колебаний, наиболее характерные для анализируемого ряда.

Существует очень большое число методов, с помощью которых решается задача выделения гармонических составляющих. Как правило, алгоритмы имеются в виде программ для вычислительных машин.

9.6Расчет статистических характеристик динамических рядов

Характеристики динамических рядов – это показатели, которые характеризуют изменения явления во времени.

Определение статистических характеристик динамического ряда основано на абсолютном и относительном сравнении уровней ряда (у2–у1) – абсолютное сравнение, у21 – относительное сравнение).

При нахождении характеристик могут использоваться два способа:

цепной способ, т. е. когда данный уровень сравнивается с предыдущим;

базисный способ, т. е. когда каждый данный уровень сравнивается с одним и тем же начальным уровнем, принятым за базу сравнения.

К статистическим характеристикам динамического ряда относят: темп роста и прироста, абсолютный прирост, базисные и цепные, абсолютное содержание 1 % прироста, средний уровень ряда, средний абсолютный прирост, сред-

ний темп роста и прироста.

1) Абсолютный прирост ( y ) – это разность между по-

следующим и предыдущим уровнями ряда (цепные) или начальным уровнем ряда (базисные). Цепной абсолютный прирост характеризует последовательное изменение уров-

105

ней ряда, а базисный абсолютный прирост – изменение нарастающим итогом. Абсолютный прирост показывает, на сколько абсолютных единиц изменился данный уровень по сравнению:

а) с предыдущим уровнем при цепном способе; б) с начальным уровнем при базисном способе.

уiцепн

где уi это i-й уровень ряда,

уi – 1 это i – 1-й уровень ряда.

уiбаз

yi yi 1,

yi y1,

где уi это i-й уровень ряда,

у1 – начальный, базисный уровень ряда.

(9.3)

(9.4)

Между цепным и базисным абсолютным приростом существует взаимосвязь – сумма цепных дает соответствующий базисный абсолютный прирост.

За весь период, описываемый рядом, абсолютный прирост выразится как разность между последним и первым уровнем ряда:

n

y yn y0 yi yi 1, (9.5) n 1

Абсолютный прирост может быть как положительным, так и отрицательным и обязательно имеет единицы измерения и размерность.

2) Темп роста (Тр) – это соотношение последующего уровня ряда к предыдущему (цепные темпы роста) или постоянному, принятому за базу сравнения (базисные темпы роста):

а) Цепные коэффициенты (темпы) роста рассчитываются по формуле:

106

Т Р

 

уi

,

(9.6)

y

цепн

 

 

 

 

 

i 1

 

 

где уi означает i-й уровень ряда, уi – 1 это i – 1-й уровень ряда.

б) базисные коэффициенты (темпы) роста рассчитываются по формуле:

Т

р

 

уi

,

(9.7)

 

баз у1

где уi – это i-й уровень ряда,

у1 – это начальный, базисный уровень ряда.

Цепной способ характеризует последовательное изменение, а базисный способ – изменение нарастающим итогом.

Между цепными и базисными темпами роста существует взаимосвязь – произведение цепных темпов роста дает соответствующий базисный темп роста.

Темп роста может выражаться в коэффициентах или в процентах.

3) Темп прироста показывает, на сколько процентов изменяется данный уровень по сравнению:

а) с предыдущим уровнем ряда при цепном способе, б) с базисным, начальным уровнем ряда при базисном

способе.

 

 

 

уi

 

 

Т

 

 

цепн

,

(9.8)

прцепн

y

 

 

 

 

 

 

 

i 1

 

 

где yiцепн – цепной абсолютный прирост i-го уровня ряда,

уi – 1 это i – 1-й уровень ряда.

 

 

 

уi

 

Т

пр

 

баз

,

 

 

9.9)

 

баз

y

 

 

1

 

 

 

 

 

 

 

107

где

– базисный абсолютный прирост i-го уровня ряда,

 

yi

 

баз

 

у1 – начальный, базисный уровень ряда.

Темп прироста обычно выражается в процентах и показывает, на сколько процентов увеличился (+) или уменьшился (–) текущий уровень по сравнению с предыдущим (базисным).

Темп прироста также можно определить исходя из темпа роста:

 

 

 

 

 

Тпр

 

Т р

1,

(9.10)

 

 

 

 

 

 

 

цепн

 

 

цепн

 

 

 

 

Т

прцепн

(%) Т

рцепн

(%) 100 %,

(9.11)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

Т

р

– цепной темп роста (в коэффициентах или в процентах).

 

 

 

 

 

 

 

 

 

 

 

 

 

цепн

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т

прбаз

 

Т

 

1,

(9.12)

 

 

 

 

 

 

 

 

 

рбаз

 

 

 

 

 

Т

 

(%) Т

рбаз

(%) 100 %,

(9.13)

 

 

 

 

 

прбаз

 

 

 

 

где

Т р

– базисный темп роста (в коэффициентах или в процентах).

 

 

 

 

 

 

 

 

 

 

 

 

 

баз

 

 

 

 

 

 

 

 

 

 

4) Абсолютное содержание одного процента прироста показывает, какая абсолютная величина скрывается за относительным показателем (одним процентом прироста):

108

 

yi

 

 

 

 

y

y

 

 

y

 

 

цеп

 

 

 

i

 

i 1

 

 

i 1

,

(9.14)

Tпрцеп

,%

yi

yi 1

100 %

100 %

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi 1

 

 

 

 

 

где yiцепн – цепной абсолютный прирост i-го уровня ряда,

Тпрцепн ,% – цепной темп прироста в процентах,

уi означает i-й уровень ряда,

уi – 1 означает i – 1-й уровень ряда.

Единицы измерения складываются из единиц измерения самого показателя и процента.

Так как показатели в течении рассматриваемого периода времени изменяются, изменяются и характеристики ряда. Поэтому, чтобы получить общее представление о изменении данных показателей следует найти обобщающие характеристики, т. е. средние величины.

5) Средний уровень ряда ( y ) характеризует среднюю

величину показателя за данный период. Средний уровень ряда рассчитывается как средняя величина из уровней ряда, причем по-разному для интервальных и моментных рядов.

В интервальных рядах по средней арифметической:

y

ар

 

y1 y2 yn

 

yi

.

(9.15)

 

 

n

n

 

В моментных рядах по средней хронологической:

yхр

 

y0 / 2 y2 yn 1 yn / 2

,

(9.16)

n 1

 

 

пр

 

 

 

где n–1 – количество изменений за данный период.

109

y

 

( y1 y2 ) t1

( y2 y3) t2 ( yn 1

yn ) tn 1

(9.17)

 

2(t1 t2 ... tn 1)

 

 

хрвзвеш

 

 

 

где у1, у2,…,уn – соответствующий уровень ряда,

t1, t2,…, tn-1– соответствующий период времени.

Средний уровень ряда – величина абсолютная, т. е. имеет определенные единицы измерения, определенную размерность.

6) Средний абсолютный прирост ( y ) – это средняя из абсолютных приростов за равные промежутки времени:

 

 

 

 

n

y

 

 

 

y

y1 y2

 

 

 

yn y0

(9.18)

yn i 1

i

 

n

1

 

n 1

 

n

 

где ∆y1+ ∆y2+ ∙ ∙ ∙ + ∆yn – соответствующий абсолютный прирост, n – 1 – количество изменений за данный период,

y – последний уровень ряда,

n

y – начальный, базисный уровень ряда.

0

7) Средний темп роста (Tp ) – это средняя из темпов

роста за данный период, которая показывает, во сколько раз в среднем (за год, месяц) изменяется явление.

Средний темп роста определяется всегда по средней геометрической.

Средний темп роста можно определить, исходя из цепных коэффициентов (темпов) роста:

 

 

 

n 1

Т р

Т р

...

(9.19)

 

 

 

Т

р

Т р

 

 

 

цепн1

цепн2

 

цепнn

или абсолютных уровней ряда (базисного темпа роста):

 

 

 

 

 

 

 

Т р

n 1Т Р

,

(9.20)

 

 

 

 

баз

 

110