Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Многомерная математическая статистика)

..pdf
Скачиваний:
9
Добавлен:
12.11.2023
Размер:
11.62 Mб
Скачать

ние и ковариации были устойчивыми и конечными, она не накладывает никаких ограничений на другие характеристики распределения ряда, например, асимметрию и эксцесс. По этой причине такую стационарность часто называют стационарностью второго порядка и тогда говорят о слабой стационарности.

На рис. 6.6 значения ряда варьируют вокруг среднего уровня, при этомамплитуда и частота колебаний остаются постоянными. Такой процесс также стационарный, поскольку его «статистики» (частота и амплитуда) не изменяются во времени (говорят, периодически стационарный, или циклостационарный). Однако, если частота, либо амплитуда изменялись бы с течением времени, это сделало бы процесс нестационарным.

Нестационарная случайная функция может быть неоднородна по математическому ожиданию и дисперсии, её положение изменяется в пространстве. Математический аппарат для использования характеристик нестационарных СФ намного сложнее, чем стационарных. Для стационарной СФ можно получить статистические выводы на основе единичной реализации. По этой причине стараются свести нестационарные СФ к стационарным. Приёмы преобразований известны: центрирование и нормирование реализаций СФ, разбиение всей области исследований на небольшие участки, в пределах которых функция стационарна, и др.

Как правило, временные ряды в горной промышленности являются нестационарными. Это связано с некоторыми особенностями рядов и прежде всего наличием у них систематической (трендовой) составляющей. Очевидно, что при наличии тренда утверждать, что среднее значение, дисперсия и автоковариация ряда не зависят от времени, нельзя, а значит, ряд нестационарен [16]. Нестационарные временные ряды могут иметь как строго возрастающий или убывающий тренд, так и колеблющийся на фоне общего тренда. Некоторые нестационарные временные ряды могут возрастать или убывать со временем и не сохранять среднего значения в долгосрочном периоде. Говорят, они характеризуются случайным блужданием. Еще одной причиной, вызывающей нестационарность временных рядов, может быть

181

влияние внезапного «шока» на временной ряд, когда статистические показатели сильно изменяются. Затем в течение короткого периода они могут вернуться к своему прежнему значению, тогда такие всплески называют выбросами. А если они остаются на новом уровне и не возвращаются к своему прежнему значению, то их именуют интервенцией.

На практике условия стационарности можно непосредственно проверить, вычислив средние значения, дисперсии и корреляционные функции для разных участков. Если значения средних и дисперсий постоянны для всех сечений, а коэффициенты корреляции между любыми двумя сечениями не зависят от постоянного сдвига, то процесс стационарен. На рис. 6.4, а показана стационарная функция, на рис. 6.4, б – нестационарная.

В 1938 г. Вольдом была опубликована работа [83] в которой он доказал, что недетерминированный стационарный в широком смысле процесс может быть представлен как сумма двух процессов – детерминированного и стохастического.

Применительно к случайным процессам это означает, что любой стационарный временной ряд может быть представлен в виде суммы двух не коррелированных между собой процессов – детерминированного, прогноз которого на некоторое время вперед безошибочен, и чисто случайного процесса типа белого шума.

Возможность разложения стационарных случайных процессов побуждает исследователей иметь дело со стационарным рядом. Несмотря на то что реальные процессы, как правило, не всегда являются стационарными, возникает желание в первом приближении считать их таковыми. Такой подход может дать удовлетворительный результат в задачах краткосрочного прогнозирования. Ряды, которые после надлежащих преобразований считаются стационарными, далее могут исследоваться методами регрессионного, корреляционного и гармонического анализов.

Если реальный временной ряд не представляет стационарный процесс второго порядка, его нужно привести к стационарному процессу. Это делается с помощью соответствующих пре-

182

образований: взятия конечных разностей первого или больших порядков, логарифмированием, вычитанием тренда и др.

Каждый из этих методов используется в процессе создания некоторой прогнозной модели для изучаемых рядов.

6.1.9. Эргодическое свойство случайной величины

До сих пор основные характеристики случайной функции предполагалось получать по множеству реализаций. Вместе с тем в горном деле, нефтегазовой и других отраслях получить несколько реализаций исследуемого признака можно только после проведения специального дорогостоящего эксперимента. Обычно имеется только одна серия проб по выработке (или по площади панели), по которой можно построить единственную реализацию.

В литературе рассматривается возможность использования и другого способа усреднения, если имеется одна реализация достаточной продолжительности. При этом если связь между сечениями случайной функции убывает быстро, то отдельные части реализации рассматриваются как независимые между собой. Совокупность таких отдельных n частей одной реализации можно принимать за совокупность n самостоятельных реализаций.

Для стационарных случайных функций известно, что математическое ожидание и дисперсия не зависят от аргумента. В связи с этим можно, не разделяя реализацию на отдельные части, определить эти характеристики по всей данной реализации.

Говорят, что стационарные функции обладают свойством эргодичности, если статистические характеристики, полученные посредством усреднения по множеству реализаций, с вероятностью, сколь угодно близкой к единице, равны статистическим характеристикам, полученным путем усреднения по достаточно длительной одной единственной реализации. Другими словами, эта единственная реализация должна быть такова, чтобы можно было вычислить основные числовые характеристики случайной функции с заданной точностью. Если это условие не выполняется, то функция будет неэргодической.

183

Достаточным, но не необходимым условием эргодичности является убывание нормированного коэффициента автокорре-

ляции до нуля по мере увеличения интервала kp l = 0 при dx = l → ∞, как показано на рис. 6.8, а.

Рис. 6.8. Графики функций: а – случайной эргодической;

б– автокорреляционной эргодической; в – случайной неэргодической;

г– автокорреляцилнной неэргодической

Если по мере увеличения интервала l → ∞ автокорреляционная функция kp (l) = dy, то такая функция неэргодическая. В этом случае величина dy характеризует дисперсию влияния некоторой случайной величины Y, которая вызвала разброс математических ожиданий отдельных реализаций mp1(x), mp2(x), mр3(x), , mpn(x) относительно общего математического ожида-

ния mp_общ (x) случайной функции (рис. 6.8, б).

В ряде случаев отдельные реализации случайного процесса могут иметь свои специфические особенности, например колебания вокруг различных средних. В этом случае среднее значение, полученное по одной реализации, может значительно отличаться от среднего по ансамблю реализаций.

По отношению к корреляционной функции свойства эргодичности формулируются гораздо сложнее, а потому проверку

184

их на практике осуществить в основном не удается. В связи с этим выводы об эргодичности делают, как правило, на основе соображений о физической сущности случайного процесса.

Выполнение свойства эргодичности имеет большое значение, так как для определения статистических характеристик достаточно располагать одной реализацией, что мы чаще всего и имеем на практике. Например, в горном деле не всегда удается осуществить многократное повторение эксперимента в одинаковых условиях, и потому все ряды наблюдений практически представляют собою единственную реализацию. Если же мы все-таки располагаем несколькими реализациями, полученными в одинаковых условиях, то, пользуясь свойством эргодичности, можно получить статистические характеристики осреднением по каждой реализации, а затем взять в качестве искомых среднее арифметическое из них с учетом веса каждой реализации.

Таким образом, свойствами стационарности и эргодичности обладают только однородные геологические данные. Понятие однородности означает отсутствие тенденций (трендов) в изменчивости признака по всей области его наблюдений, а также отсутствие колебаний с периодом, сопоставимым с размерами области. На графиках однородных данных закономерная составляющая изменчивости признака может проявляться в виде локальных колебаний со случайными периодами, по крайней мере на порядок меньшими величины интервала наблюдений.

6.2.Анализ временных рядов

6.2.1.Обработка и анализ временных рядов

Обработка временных рядов проводится с целью извлечения из них полезной информации о свойствах ряда. Основным постулатом, на котором базируется теория временных рядов для анализа и прогнозирования, является то, что факторы, влияющие на полученные данные, воздействовали некоторым образом на наблюдаемый процесс в прошлом и настоящем, и предпола-

185

гается, что они будут действовать схожим образом и в не очень далеком будущем. Поэтому основной целью анализа временных рядов будет разложение их на составные компоненты (или декомпозиция) с целью дальнейшего прогноза временного ряда. Разложение временных рядов является формой описательного моделирования. Это означает, что специалист, выполняющий моделирование временных рядов, изучает набор исходных данных, чтобы выявить общие тенденции в наблюдениях, оценить возможные циклические закономерности и связать их с внешними обстоятельствами. Такой анализ временных рядов позволяет извлечь значимую информацию из исходных данных, чтобы понять характер его изменения во времени. Но чаще всего в основном внимание в этих исследованиях уделяется прогнозу динамики развития временного ряда. Если удалось выделить тренд временного ряда, к примеру линейным уравнением, появляется возможность продлить линию на шаг (или несколько шагов – лагов) вперёд. Если мы будем делать это графически, говорят, будем экстраполировать линию (тренда). Прогноз основан на предположении закономерности распространения выводов, полученных из наблюдения над одной, известной, частью процесса (графика) на другую, новую (неисследованную), его часть.

Таким образом, если анализ временных рядов является формой описательного моделирования, то прогнозная модель позволяет предсказать развитие временного ряда в обозримом будущем.

6.2.2.Пример временного ряда

Вкалийно-магниевых рудниках большие объёмы пресной воды недопустимы. Она растворяет соленосные пласты, ослабляет целики. Особенно опасно, когда пресная вода в выработки попадает с водоносных горизонтов. Растворяя на своём пути соленосные породы, она формирует каналы, по мере поступления пресной воды они увеличивают свои размеры, и в этом случае появляется угроза затопления рудника. Но пресная вода по-

186

падает в выработки ещё и с воздухом вентиляционных потоков. Особенно много её поступает в тёплое время года. При снижении температуры частично эта влага конденсируется на стенках выработок, часть её адсорбируется окружающим выработку массивом. В холодное время года через ствол поступает воздух с минимальным содержанием влаги. По мере прохождения выработки вентиляционный поток впитывает влагу со стен выработок и с почвы, переносит её далее по выработкам. По мере снижения температуры влага снова может выпасть на стенки выработок в других местах или выносится с отработанной воздушной струёй в атмосферу [30]. Помимо пресной воды, в выработках встречаются и рассолы. Они попадают с гидравлической закладкой, могут встречаться локальные линзы минерализованной жидкости при проходке выработок. Часть жидкости скапливается в локальных пониженных участках выработки, но основная масса рассолов и пресной воды собирается в рассолосборник. Гидрогеологи постоянно наблюдают за состоянием и концентрацией солей на локальных участках и рассолосборнике. По концентрации солей в рассолах они определяют типы: конденсационный, из гидравлической закладки или другой. Любое изменение концентрации солей требует изучения и разъяснения.

Анализ рассматриваемого временного ряда проведём в программе Statistica в модуле «Временные ряды». На рис. 6.9 приведены поквартальные данные о суммарной концентрации солей в рассолосборнике одного из рудников ПАО «Уралкалий». Западное крыло рудника отработано и заложено гидравлической закладкой. График многолетних наблюдений за концентрацией солей носит ритмичный характер и не вызывает опасений в затоплении горных выработок.

Из рисунка видно, что концентрация солей принимает максимальное значение в зимний период (квартал 1, 5, 9...). В летнее время происходит разбавление рассолов пресной водой, конденсируемой из воздушных потоков, содержание солей уменьшается. Таким образом, наблюдается определенная цикличность (повторяемость) с периодом цикла 4 квартала (12 месяцев).

187

Рис. 6.9. Поквартальный график изменения концентрации солей рассолов (Пер 7): С – концентрация солей, %; 1-й квартал – зима

(1, 5, 9…); 2-й – весна (2, 6, 10…); 3-й – лето (3, 7, 11…); 4-й – осень (4, 8, 12…). Тренд = 45,27 + 0,003 · t, где t – номер месяца

Среднее за год изменение концентрации солей носит равномерный характер, закономерности колебаний солей объяснимы, генеральная составляющая (тренд) описывается линейным уравнением с небольшим подъёмом. Небольшая величина коэффициента регрессии перед аргументом, равная 0,003, показывает незначительное увеличение концентрации солей к 56-му кварталу от начала мониторинга. Свободный член показывает общее среднее на начальном этапе наблюдений и равен 45,27.

6.2.3.Компоненты временного ряда

6.2.3.1.Общие сведения

Врегрессионном анализе мы выводили и анализировали закономерную составляющую уравнения и остаток. Значения временного ряда в разные периоды формируются под воздействием многих факторов, которые условно можно подразделить на несколько составляющих – компонентов. Первым шагом при анализе временного ряда для разработки прогностической моде-

188

ли также является выявление и понимание закономерностей, лежащих в основе данных с течением времени. Среди основных причин формирования рядов принято выделять следующие четыре компоненты [6; 10; 35; 55].

Тренд (T) – длительная и постепенная тенденция изменения ряда, не циклическая компонента, описывающая чистое влияние долговременных факторов, эффект которых сказывается постепенно. Другими словами, тренд – это очищенная от сезонных и случайных изменений основная тенденция временного ряда. Это может быть самая простая линейная модель, она демонстрирует долгосрочный рост или спад анализируемого ряда, если он имеет достаточно простую структуру, позволяющую вычленить линейную составляющую. Однако для рядов сложной структуры построение формальной модели тренда является непростой задачей. В частности, из содержательного описания не всегда ясно, какой функцией моделировать тренд. Компоненты временного ряда могут входить в него аддитивно или мультипликативно.

Существует две основные категории методов выделения трендов из временных рядов. Первая категория использует технологии множественной регрессии с факторами, являющимися функциями времени, вторая основана на применении линейных или иных фильтров и сглаживания.

Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда часто обнаруживают правильность колебаний. Часто это связано с естественной или назначенной периодичностью, например, сезонной – суточной, месячной или иной.

Например, в течение года средняя температура воздуха в Перми в 2020 г. составляет 3 °C [71]. Это почти постоянная величина, и, если верить гипотезе о глобальном потеплении, повышение средней температуры можно будет описать линейным трендом с небольшим подъёмом. В течение года её изменения подчиняются сезонным колебаниям: самым холодным месяцем в Перми является январь со средней температурой – 14,1 °C, а

189

самым теплым август, когда столбик термометра в среднем поднимается до 17,2 °C.

Сезонность (S) – циклические, краткосрочные компоненты модели, которые возникают в течение не очень продолжительного периода и повторяются многократно. Сезонные эффекты присущи многим сферам деловой активности, многие производства имеют сезонный характер работы. Например, потребление калийных удобрений также имеет ярко выраженную сезонность.

Циклическая составляющая (C) – долгосрочные колебания данных, на которые могут уйти годы или десятилетия. Такие колебания происходят непредсказуемо, в экономике они часто являются отражением экономических условий. Эта компонента занимает промежуточное положение между закономерной и случайной составляющими временного ряда.Циклическая компонента временного ряда описывает длительные периоды относительного подъёма и спада анализируемой переменной.

Выбор сезонной (или циклической) составляющих проводится на основе анализа структуры колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.

Структурные сдвиги (SS) – это аномальные изменения временного ряда, связанные с редко происходящими событиями, имеющими скачкообразный характер и меняющими тенденцию. Их нередко именуют интервенцией, а временной ряд – рядом с интервенцией.

Ошибка, или остаток, (E) – остаточные случайные колебания, не поддающиеся учёту и обусловленные влиянием случайных факторов. Остатки содержат случайную ошибку, которая затрудняет обнаружение регулярных компонент. На практике, как правило, используются такие методы исследования временных рядов, которые включают различные способы

190

Соседние файлы в папке книги