Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ковалевский. Книжки по геостатистике / EAGE_Kovalevsky_SLTRU_2011_Geological_Modelling_on_the_Base_of_Geostatistics

.pdf
Скачиваний:
288
Добавлен:
03.06.2015
Размер:
33.97 Mб
Скачать

факторов геостатистические реализации отличаются друг от друга значительно меньше, чем оптимистический и пессимистический вариант детерминированной модели.

Из сказанного следует, что экспертная оценка погрешности детерминированной модели оказывается, в сравнении с оценкой погрешности по геостатистическим реализациям, сильно завышенной. Прогноз запасов по детерминированной модели показан на рис. 22 синей кривой (при том же среднем).

И что в результате? Оценка P90 для детерминированной модели оказывается равной 2080 тысяч тонн. То есть, после детерминированного моделирования ГКЗ примет у нас на 200 тысяч тонн нефти меньше, чем после моделирования (той же площади и по тем же данным) на основе геостатистики!

37

3. Кригинг

3.1. Что такое кригинг?

Подведем очередной промежуточный итог. Мы выяснили, что суть геостатистики в том, что вместо одной карты или одного куба параметра, полученных в результате интерполяции точечных данных и надежность которых нам неизвестна, мы имеем бесконечный набор реализаций – карт или трехмерных кубов. Каждая из этих реализаций соответствует априорной модели случайной переменной (среднему значению, дисперсии и вариограмме) и ее известным точечным значениям. В заданных точках все реализации совпадают, но по мере удаления от этих точек отличия реализаций друг от друга постепенно нарастают. Закон, по которому нарастают эти различия, и предел этого нарастания определяются вариограммой. Совокупность реализаций дает нам очевидный критерий для оценки полноты (или, наоборот, неполноты) наших данных и позволяет судить об их достаточности (или недостаточности) для решения конкретной задачи.

Мы выяснили суть геостатистики, но ни разу не упомянули о ее главном методе – кригинге. Что же такое кригинг и какова его роль?

Дело в том, что, изложив суть геостатистики, мы не ответили на два важных вопроса. Первый вопрос: как нам быть, когда от нас требуют все же только одно решение? И второй вопрос: как рассчитываются описанные реализации?

Два этих вопроса имеют один ответ – надо использовать кригинг. Кригинг это такая детерминированная интерполяция (одна карта, один трехмерный куб параметра), относительно которой ожидаемое отклонение реализаций минимально. Например, в некоторой точке X, Y на плоскости или X,Y,Z в пространстве (и если это не есть точка данных) реализации дадут нам некоторое распределение значений нашего параметра. Так вот, кригинг, по определению, имеет в этой точке значение, относительно которого среднеквадратичное отклонение реализаций минимально.

Если возможные значения случайной переменной в точке пространства распределены нормально, то требуемым свойством обладает центр распределения (он же тогда есть среднее). Значения в точке пространства, которые дают нам наши реализации, распределены именно нормально. Отсюда следует, что кригинг совпадает с результатом осреднения реализаций.

Кригинг называют детерминированным решением, основанным на случайной модели среды (на вариограмме). Если нам надо дать одно решение, гарантирующее минимальное отклонение от неизвестной реальности в каждой точке пространства, то мы должны дать кригинг. Но при этом мы должны понимать, что по своим свойствам (по гистограмме и вариограмме, то есть по характеру пространственной изменчивости) кригинг резко отличается от реализаций.

Можно ли рассчитывать кригинг, усредняя реализации? Нет, все делается ровно наоборот. Для расчета реализаций нужен кригинг. Но о расчете реализаций мы будем говорить значительно позднее.

38

3.2. Вывод системы уравнений кригинга

Пусть Z(x) есть случайная функция, являющаяся случайной переменной в каждой точке x. Мы знаем априорную модель этой функции, то есть ее ковариацию C(h). Оценку для случайной функции Z(x0) в точке прогноза x0 (обозначим эту оценку Zk(x0), индекс k есть сокращение от «кригинг») будем искать как взвешенное среднее от ее же значений Z(xi) в заданных точках xi, i = 1, 2,…, n, используя весовые коэффициенты λi:

n

Zk (x0 ) = λi Z (xi )

i=1

Рис. 23. Оценка Zk(x0). Для наглядности показан одномерный случай и только две заданные точки, x1 и x2. При помощи коэффициентов λi минимизируется средний квадрат разности Zk(x0) и Z(x0). (названные разности выделены красным цветом). Осреднение идет по бесконечному числу реализаций. Показаны три реализации, отвечающие ковариации C(h).

Неизвестные коэффициенты λi мы подберем так, чтобы оценка Zk(x0) минимизировала вариацию (средний квадрат разности) между Z(x0) и Zk(x0). Что именно мы хотим минимизировать, поясняет рис. 23. Рассматриваемая вариация имеет вид:

Var[Zk (x0 ) Z (x0 )] = E[(Zk (x0 ) Z (x0 ))2 ] =

= E[(Zk (x0 ))2 ] + 2E[Zk (x0 )* Z (x0 )] + E[(Z (x0 ))2 ] = ...

Напоминаем, что математическое ожидание E рассчитывается посредством осреднения по бесконечному числу реализаций, отвечающих ковариации C(h).

39

 

n

n

 

... = E[(λi Z (xi ))2 ] 2E[(λi Z (xi ))* Z (x0 )]+ E[(Z (x0 ))2 ] = ...

 

 

i=1

i=1

 

n

n

n

 

... = ∑∑

λiλ j E[Z (xi )* Z (x j )] 2λi E[(Z (xi )* Z (x0 )] + E[(Z (x0 ))2 ]

(7)

i=1

j=1

i=1

 

Прежде, чем идти дальше, вспомним определение (4) ковариации случайной функции Z(х). Для большей наглядности запишем его для случая, когда среднее m равно нулю:

Cov(Z (x), Z (x + h)) = E[Z (x)* Z (x + h)] = C(h)

(4a)

Есть ли разница между математическим ожиданием E в выражении (7) и математическим ожиданием E в выражении (4а)? Да, разница есть. В первом случае осреднение идет для одной пары точек по бесконечному числу реализаций, а во втором случае – для одной реализации, но по бесконечному числу пар.

Однако существует так называемая эргодическая теорема, гласящая, что среднее для одной точки по множеству реализаций (а также дисперсия для одной точки и ковариация для одной пары точек) и среднее по множеству точек для одной реализации (а также дисперсия по множеству точек и ковариация по множеству пар с фиксированным h) равны. Подробнее смотрите, например, книгу Демьянов, Савельева, 2010. На основании этой теоремы мы можем записать следующее (ниже E означает осреднение по бесконечному числу реализаций):

Cov[Z (xi ), Z (x j )] = E[(Z (xi ) m)*(Z (x j ) m)] = C(xi , x j ) = Ci j = C(h), Cii = C(0)

где h есть расстояние между точками xi, xj.

После этого присутствующие в (7) члены вида E[Z(xi)*Z(xj)] можно выразить через ковариацию C(h). Из выражения (7) выводятся системы уравнений простого, обыкновенного и универсального кригинга.

3.2.1. Простой кригинг

Простой кригинг соответствует случаю, когда функция Z(x) имеет известное среднее m, равное нулю. (Если среднее не ноль, мы просто вычтем его из всех данных). Тогда математическое ожидание E[Z(xi)* Z(xj)] сразу дает нам ковариацию Cij и выражение (7) для вариации приобретает вид:

n

n

n

 

Var[Zk (x0 ) Z (x0 )] = ∑∑λiλ jCij 2λiCi0 + C00

(8)

i=1

j=1

i=1

 

Относительно каждого весового коэффициента λi вариация в точке x0 представляет собой квадратичную функцию aλi2 + bλi + c (a>0), то есть графически выглядит как парабола, уходящая

40

вверх. Минимум параболы достигается в той точке, где ее производная равна нулю. Поочередно дифференцируем выражение (8) для вариации по λ1, λ2,.. λn и приравниваем результат дифференцирования к нулю:

λ1C11 + λ2C12 + ...+ λnC1n C10 = 0 λ1C21 + λ2C22 + ...+ λnC2n C20 = 0

........................................................

λ1Cn1 + λ2Cn2 + ...+ λnCnn Cn0 = 0

Мы получили систему уравнений. В матричном виде она выглядит так:

C(0)

C12

... C1n

 

λ1

 

C10

 

 

 

 

C21

C(0)

... C2n

*

λ2

=

C20

(9)

... ... ... ...

...

...

 

 

 

Cn1

Cn21

...C(0)

 

λn

 

Cn0

 

Эта система уравнений называется системой уравнений простого кригинга. Она определяет искомые λ1, λ2,.. λn, необходимые для вычисления Zk(x0). Если значения наших реализаций Z(xi) в точках данных фиксированы (обратите внимание, в ходе вывода мы этого не требовали, см. рис. 23), то и в точке прогноза мы тоже получим фиксированное интерполированное значение.

Посмотрим на полученную систему уравнений (9). Все коэффициенты Сij нам известны. Откуда мы их берем? Мы их снимаем с графика ковариации C(h) (рис. 12), приравнивая h к расстоянию между точками xi и xj. Матрица коэффициентов системы уравнений зависит, таким образом, только от C(h) и координат точек данных. Размерность матрицы коэффициентов равна числу точек данных. Столбец же правой части зависит от координат точки прогноза. Чтобы выполнить интерполяцию кригингом точек данных на плане XY, необходимо задать сетку на плане XY и решить систему уравнений (9) в каждом узле сетки.

Выполним относительно полученной системы уравнений небольшое исследование. Допустим, точка прогноза x0 совпадает с точкой данных x1. В этом случае столбец правой части системы уравнений будет точно совпадать с первым столбцом матрицы коэффициентов. Решением такой системы уравнений будет λ1 равно 1, а все остальные λ2,.. λn равны нулю. То есть, прогнозное значение будет равно значению в точке данных x1, как и должно быть.

Рассмотрим второй случай. Допустим, точка прогноза x0 удалена от точек данных на бесконечность. При этом правая часть системы превращается в столбец из нулей, и решением системы будут все λ1,.. λn равные нулю. Следовательно, прогнозное значение в точке x0 будет равно нулю. Это соответствует нашему исходному условию о нулевом среднем – при удалении от точек данных на расстояние, большее радиуса вариограммы, кригинг выходит на среднее.

41

3.2.2. Универсальный кригинг

Система уравнений универсального кригинга выводится в предположении, что случайная функция Z(x) является суммой неизвестного полиномиального тренда и остатка с нулевым средним. Рассмотрим случай 2D, когда координата x имеет две компоненты – x, y. Сложность последующих уравнений зависит от того, какую степень тренда мы принимаем. Для простоты уравнений ограничимся только линейным трендом от координат x, y, то есть будем считать, что случайная функция Z(x) имеет линейный тренд T(x) = T(x,y) = ax + by + c. Для краткости обозначим T(xi) как Ti. Тогда математическое ожидание E[Z(xi)* Z(xj)] в выражении (7) можно представить как:

E[(Z (xi )*(Z (x j )] =

=E{[(Z (xi ) T (xi ) + T (xi )]*[(Z (x j ) T (x j ) + T (x j )]} =

=E{[(Z (xi ) T (xi )]*[(Z (x j ) T (x j )]}+

+ E{[(Z (xi ) T (xi )]*T (x j )}+ E{T (xi )*[(Z (x j ) T (x j )]}+ E{T (xi )*T (x j )} =

=C(xi , x j ) + 0 + 0 + T (xi )*T (x j ) =

=Cij + Ti *Tj

Впоследнем выражении стоит ковариация остатка без тренда. Подставляя выведенное математическое ожидание E[Z(xi)* Z(xj)] в выражение (7), получаем:

n

n

n

Var[Zuk (x0 ) Z (x0 )] = ∑∑λiλ j{Cij + TiTj }2λi{Ci0 + TiT0}+ C00 + T0T0

i=1

j=1

i=1

Выше индекс uk обозначает «универсальный кригинг». Разделим члены, зависящие и не зависящие от тренда:

n

n

n

Var[Zuk (x0 ) Z (x0 )] = F (λi ,..., λn ) + ∑∑λiλ jTiTj 2λiTiT0 + T0T0

i=1

j=1

i=1

Перегруппируем члены, зависящие от тренда:

n

Var[Zuk (x0 ) Z (x0 )] = F(λi ,...,λn ) + (λiTi T0 )2

i=1

Относительно каждого коэффициента линейного тренда a, b, c вариация является квадратной функцией (параболой, направленной вверх), минимум которой достигается в точке, где производная равна нулю. Дифференцируя вариацию по параметрам a, b, c и приравнивая результат к нулю, получаем три уравнения:

n

 

λi xi x0

= 0

i=1

 

n

 

λi yi y0

= 0

i=1

42

n

λi 1 = 0

i=1

Обозначим эти уравнения как

ϕ1(λi ,...,λn ) = 0

ϕ2 (λi ,..., λn ) = 0

ϕ3 (λi ,..., λn ) = 0

Наличие тренда приводит к тому, что коэффициенты λi должны удовлетворять этим трем дополнительным уравнениям. Экстремум функции F(λ1, …, λn) при наличии дополнительных условий вида ϕk(λ1, …, λn) = 0, где k = 1, 2,…,m, ищется как экстремум функции

m

F(λi ,...,λn ) + μkϕk (λ1,...λn )

k =1

Коэффициенты μk называются множителями Лагранжа (смотрите, например, Г. Корн, Т. Корн, «Справочник по математике для научных работников и инженеров», М., 1968, стр. 320). В нашем случае надо искать экстремум функции

F (λi ,..., λn ) + μϕ3 (λ1,...λn ) + μ xϕ1 (λ1,...λn ) + μ yϕ2 (λ1,...λn )

Последовательно дифференцируем показанную функцию по λ1, λ2,.. λn и приравниваем каждый результат к нулю:

λ1C11 + λ2C12 + ...+ λnC1n + μ + μ x x1 + μ y y1 C10 = 0 λ1C21 + λ2C22 + ...+ λnC2n + μ + μ x x2 + μ y y2 C20 = 0

....................................................................................

λ1Cn1 + λ2Cn2 + ...+ λnCnn + μ + μ x xn + μ y yn Cn0 = 0

Объединяя эти уравнения с тремя полученными ранее, приходим к искомой системе уравнений для универсального кригинга:

43

 

C(0)

C12

... C1n

1

x1

y1

 

 

 

λ1

 

 

 

C10

 

 

 

 

 

 

 

 

 

C21

C(0)

... C2n

1 x2

y2

 

 

 

λ1

 

 

 

C20

 

 

 

... ... ... ... ... ... ...

 

 

 

...

 

 

 

...

 

 

 

Cn1

Cn2

...C(0) 1 xn

yn

 

*

 

λ1

 

=

 

Cn0

 

(10)

 

1

1

...

1

0

0

0

 

 

 

μ

 

 

 

1

 

 

 

x1

x2

...

xn

0

0

0

 

 

 

μ x

 

 

 

x0

 

 

 

y1

y2

 

yn

0 0

0

 

 

 

μ y

 

 

 

y0

 

 

Некоторое внутреннее противоречие универсального кригинга заключается в том, что, хотя тренд может оставаться неизвестным, ковариации Cij нам нужны без тренда (то есть рассчитанные после того, как тренд исключен, или по участку, где тренда нет). Названное противоречие снимается тогда, когда мы используем универсальный кригинг с опцией «скользящая окрестность» (см. ниже). В этом случае решение будет лучше, если мы будем автоматически учитывать переменный (и неизвестный) линейный тренд в пределах каждой окрестности.

3.2.3. Обыкновенный кригинг

Обыкновенный кригинг (не путать с простым кригингом) есть упрощенный вариант универсального кригинга, когда тренд является неизвестной константой, то есть T(x,y) = c. Убирая в (10) лишние члены, получаем систему уравнений обыкновенного кригинга:

 

C(0) C12

...

C1n

1

 

 

 

λ1

 

 

 

C10

 

 

 

 

 

 

 

 

C21

C(0)

...

C2n

1

 

 

 

λ2

 

=

 

C20

 

 

... ... ... ...

...

 

*

 

...

 

 

...

(11)

 

Cn1

Cn2

...

C(0)

1

 

 

 

λn

 

 

 

Cn0

 

 

1

1

...

1

0

 

 

 

μ

 

 

 

1

 

Обыкновенный кригинг отличается от простого тем, что нам не требуется явно указывать среднее значение для случайной переменной Z(x). Мы уже говорили, что среднее значение случайной переменной Z(x) не следует путать со средним значением случайной переменной Z(x) в известных точках. Обыкновенный кригинг сам выбирает уровень, на который решение выходит при удалении от точек данных на расстояние, большее радиуса вариограммы. Это важное его преимущество. Также понятно, что обыкновенный кригинг не содержит того внутреннего противоречия, которое содержит универсальный – тренд в виде T(x,y) = c не мешает нам рассчитать экспериментальную вариограмму, а значит и ковариации Cij. По этим двум причинам именно обыкновенный кригинг используется наиболее часто.

Проведем наше короткое исследование. Очевидно, что если точка прогноза x0 совпадает с точкой данных x1, то прогнозное значение будет равно значению в точке данных x1. Пусть теперь точка

44

прогноза x0 удалена от точек данных на бесконечность. Чтобы получить оценку быстро, примем еще одно упрощение – пусть вариограмма имеет вид «ступеньки». Тогда у нас, помимо ковариаций в правой части, обнулятся еще и все недиагональные ковариации в матрице коэффициентов. Решением будет μ = -С(0)/n и все λ1,.. λn равны 1/n. Соответственно, значение кригинга на бесконечности будет равно среднему значению, рассчитанному по точкам данных. Но это только если радиус вариограммы меньше расстояния между точками данных. Если радиус вариограммы превышает расстояние между точками данных, то при определении уровня на бесконечности точки данных будут иметь разные веса. А именно, индивидуальные веса близких друг к другу точек будут меньше весов удаленных точек.

Как будет отличаться интерполяция одних и тех же точечных данных в зависимости от того, какой кригинг мы применили – простой, обыкновенный, или универсальный? Ответ показан на рис. 24. Это интерполяция поверхности по отметкам на скважинах. Там, где у нас достаточная плотность данных, разницы не будет никакой. Отличия будут только на удалении от точек данных, большем радиуса вариограммы, то есть главным образом в краевых областях. Простой кригинг при удалении от скважин выходит на горизонтальный уровень, который мы ему указали. Это чревато ошибкой – на рис. 24 мы указали уровень, который является слишком низким. Обыкновенный кригинг при удалении от скважин выходит на оптимальный горизонтальный уровень, который он рассчитывает сам. Универсальный кригинг при удалении от скважин выходит на оптимальную наклонную плоскость (линейный тренд), которую он тоже рассчитывает сам.

45

Рис. 24. Интерполяция поверхности по отметкам на скважинах при помощи простого (а), обыкновенного (б) и универсального (в) кригинга.

3.3. Скользящая окрестность

Итак, мы теперь знаем, что каждое интерполированное значение кригинга есть взвешенное среднее от величин в известных точках. Весовые коэффициенты получаются в результате решения системы, число уравнений в которой равно числу точек данных. Для расчета кригинга на сетке 1000х1000 необходимо решить названную систему уравнений миллион раз (минус число точек с данными). Желая ускорить расчет, часто используют опцию «скользящая окрестность». Названая

46

Соседние файлы в папке Ковалевский. Книжки по геостатистике