
- •Лекция 3. Основные понятия и элементы геостатистики
- •1. Пространственно распределенные данные
- •2. Метрика в пространстве
- •3. Пространственное разрешение
- •4. Сеть мониторинга и кластерность
- •5. Декластеризация
- •6. Пространственная непрерывность
- •7. Стационарность в строгом и мягком смыслах
- •8. Геостатистическое оценивание
- •9. Проверка качества модели - кросс-валидация
Лекция 3. Основные понятия и элементы геостатистики
Вопросы для изучения:
1. Пространственно распределенные данные
2. Метрика в пространстве
3. Пространственное разрешение
4. Сеть мониторинга и кластерность
5. Декластеризация
6. Пространственная непрерывность
7. Стационарность в строгом и мягком смыслах
8. Геостатистическое оценивание
9. Проверка качества модели - кросс-валидация
1. Пространственно распределенные данные
При анализе данных различных измерений часто крайне трудоемко или вовсе невозможно получить формульный закон распределения данных на основе физических процессов, обуславливающих соответствующие явления.
Альтернативный подход - статистическое (а не детерминистическое) описание пространственного распределения. В отличие от детерминистических методов, геостатистические оценки опираются на информацию о внутренней структуре данных, зависят от самих данных, т. е. являются адаптивными. Геостатистика базируется на статистической интерпретации данных. Предполагается, что данные измерений z(х) являются реализациями случайных переменных Z(x), которые описываются некоторыми функциями распределения. Это, однако, не означает, что природа самого процесса является случайной. Чтобы использовать геостатистику, необходимо определить пространственную корреляционную структуру поля Z(x), задаваемую всеми случайными переменными в области исследования. Геостатистический подход позволяет исходить при анализе из строгих критериев.
Предметом анализа геостатистики являются пространственные переменные (или регионализованные переменные — regionalised variables), что аналогично переменным с координатной привязкой. Примеры пространственных переменных: количество осадков, плотность населения в некоторой географической области, мощность геологической формации, плотность загрязнения почвы, среднее потребление электроэнергии в определенный час и т.п.
Пространственные переменные не следует путать со случайными величинами, изучаемыми методами обычной статистики. Случайная функция определяется как набор обычно зависимых между собой случайных переменных Z(x), по одной для каждого местоположения х в рассматриваемой области. Любому набору из местоположений {хк, к = 1,N} можно поставить в соответствие N случайных переменных {Z(х1),..., (Z (хN)}, которые характеризуются N-мерной условной функцией распределения:
(2.1)
Понятие случайной величины в классической статистике имеет конкретный смысл только при соблюдении следующих условий:
должна быть хотя бы теоретическая возможность бесконечного повторения испытаний (реализаций), в результате которых случайная величина приобретает численные значения;
результат каждого из испытаний должен быть независим от результатов всех предыдущих испытаний.
Пространственная переменная не удовлетворяет ни одному из этих условий (!). Если, например, испытание состоит в отборе пробы в точке х, то содержание искомого вещества в такой пробе будет единственным, физически определенным и ни в коей мере не случайным. Нет никакой возможности повторить такое испытание, поскольку проба в конкретной точке уже взята, что влечет невыполнение условия 1. Однако есть возможность отобрать новую пробу в непосредственной близости от точки х, что можно в приближении принять за выполнение условия 1. Но тогда нарушается условие 2. Если первая проба отобрана в обогащенной зоне, то вторая проба, взятая в непосредственной близости от первой, как правило, будет иметь высокое содержание. Таким образом, испытания оказываются зависимыми.
В дальнейшем мы будем использовать для удобства привычный в статистике термин случайной величины, понимая под ней пространственную регионализованную переменную и учитывая вышеописанные особенности. На блюдаемая переменная может быть непрерывной (например, любая физическая величина - плотность, давление, концентрация и т. п.) или категориальной (например, тип почвы либо геологической породы). Для анализа переменных разного типа естественно использовать различные подходы.