
- •Лекция 3. Основные понятия и элементы геостатистики
- •1. Пространственно распределенные данные
- •2. Метрика в пространстве
- •3. Пространственное разрешение
- •4. Сеть мониторинга и кластерность
- •5. Декластеризация
- •6. Пространственная непрерывность
- •7. Стационарность в строгом и мягком смыслах
- •8. Геостатистическое оценивание
- •9. Проверка качества модели - кросс-валидация
7. Стационарность в строгом и мягком смыслах
Пространственная непрерывность связана с другим краеугольным понятием — стационарностью. Стационарность в строгом теоретическом смысле определяется следующим образом.
Если совместная функция распределения (2.1) инвариантна относительно положения начала координат, то в этом случае говорят о стационарности случайной функции Z(x) в области S. Это означает, что любые два вектора случайных переменных {Z(х1...Z(xN)} и {Z(х1 + h), Z(xN + h)} имеют одинаковые условные многомерные функции распределения независимо от вектора сдвига h:
т. е. функция распределения является трансляционно инвариантной.
Пространственная стационарность в строгом смысле означает, что распределения случайной величины в двух различных зонах области распределения являются идентичными. Таким образом, полная стационарность является скорее теоретическим, чем реально применимым для моделирования природных явлений понятием.
Пространственная нестационарность заключается в меняющемся характере функции распределения в зависимости от местоположения точек измерения.
Гипотеза о пространственной стационарности функции распределения часто необходима при решении задач пространственной интерполяции. Условие стационарности является весьма строгим, поэтому на практике используются более мягкие условия стационарности второго порядка (стационарность в широком смысле) или внутренняя гипотеза. В рамках предположения о стационарности второго порядка, в частности, работает базовый метод геостатистики — кригинг.
Случайная функция Z(x) обладает стационарностью второго порядка, если [JourneL Huijbregts, 1978]:
математическое ожидание т(х) существует и не зависит от местоположения х:
для каждой пары значений случайной переменной {Z(x), Z(x + h)} ковариация существует и зависит только от разности координат h:
Таким образом, стационарность второго порядка — это стационарность только для моментов первого и второго порядка.
Случайная функция Z(x) удовлетворяет внутренней гипотезе, если:
математическое ожидание т(х) существует и не зависит от местоположения х:
для любого вектора h разность Z(x) - Z(x + h) имеет конечную вариацию, не зависящую от x (стационарность приращений):
Из внутренней гипотезы следует определение одного из ключевых понятий геостатистики — вариограммы. Функция y(h) носит название полувариограммы (или вариограммы) и является статистическим моментом второго порядка. Внутренняя гипотеза (intrinsic hypothesis) соответствует стационарности второго порядка для приращений функции.
Центральная идея геостатистики состоит в использовании знаний о пространственной корреляции экспериментальных данных для построения пространственных оценок и интерполяций. Вариограмма — ключевой инструмент для оценки степени пространственной корреляции, имеющейся в данных, и для ее моделирования. Модель вариограммы является функцией, определяющей зависимость изменения исследуемой величины в пространстве от расстояния. Следовательно, интерполяционная модель, основанная на такой корреляционной функции, будет отражать реальные явления, которые лежат в основе данных измерений.
В условиях стационарности второго порядка корреляция между измерениями в двух точках, как уже указывалось, предполагается зависящей только от разности местоположений этих точек. С точки зрения пространственных корреляций это означает, что различные регионы статистически подобны, что позволяет интерпретировать различные регионы как различные реализации стохастической региональной функции и делать статистические выводы. Таким образом, значения измерений, проведенных в некотором конечном множестве точек, могут быть исследованы с точки зрения поведения разности между ними. Всевозможные пары точек могут быть рассортированы по классам в соответствии с разностью их координат h = хi - хj, называемой лагом (или лэгом — lag). Для близких точек разность значений функции в них обычно меньше и растет с увеличением расстояния между точками. Вычислив среднее значение квадратов разностей для каждого значения лага h (для каждого собранного класса пар измерений), можно получить дискретную функцию, называемую экспериментальной вариограммой (sample variogram, или raw variogram — вариограммой сырых данных).
Теоретически поведение экспериментальной вариограммы должно иметь отношение к пространственной корреляции между образцами и может содержать количественную информацию о пространственном процессе. Но чтобы использовать эту информацию в теоретических исследованиях и практических оценках, необходимо построить непрерывную гладкую функцию, которая будет представлять собой теоретическую модель экспериментальной вариограммы. После такой подгонки (fitting) модельной вариограммы к экспериментальному образцу первая может быть использована для вычисления весов при интерполяции кригингом.
Вариограмма, вообще говоря, — это функция векторного аргумента h. Часто случается, что пространственная корреляция зависит не только от расстояния между точками измерений, но и от направления, т. е. данные могут обладать пространственной анизотропией. В этом случае оцениваются вариограммы по направлениям (directional variograms) и строится общая анизотропная модель вариограммы.
Свойство эргодичности по отношению к пространственным данным означает, что при вычислении различных статистических моментов можно переходить от усреднения по реализациям к усреднению по пространству, а также делать при этом статистические выводы.