- •1.1. Моделирование геологических процессов и явлений
- •1.2. Характер геологической информации
- •1.3. Понятие о геолого-математическом моделировании
- •1.4. Принципы и методы геолого-математического моделирования
- •2. ОДНОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •2.1. Сущность и условия применения
- •2.2. Статистические характеристики, используемые в геологии
- •2.3. Точечные и интервальные оценки свойств геологических объектов
- •2.4. Основные статистические законы распределения, используемые в геологии
- •2.5. Статистическая проверка геологических гипотез
- •2.7. Проверка гипотез о равенстве дисперсий
- •2.8. Анализ однородности выборочных геологических совокупностей
- •2.9. Однофакторный и двухфакторный дисперсионный анализ
- •3. МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •3.2. Многомерный корреляционный анализ
- •3.3. Статистические методы выделения ассоциаций химических элементов
- •3.4. Кластер-анализ (дендрограммы и дендрографы)
- •3.6. Задачи распознавания образов в геологии
- •3.8. Оценка информативности геологических признаков
- •3.9. Линейные дискриминантные функции
- •3.10. Метод главных компонент
- •4. МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННЫХ ПЕРЕМЕННЫХ
- •4.2. Элементы неоднородности, изменчивость и анизотропия гелогических полей
- •4.4. Фон, аномалии и поверхность тренда
- •4.5. Геометрические методы выявления закономерных составляющих признаков
- •4.6. Способы сглаживания случайных полей
- •4.7. Анализ карт
- •4.8. Метод ближайшего соседа
- •4.9. Поверхности тренда
- •4.10. Сравнение карт
- •4.15. Моделирование дискретных случайных полей
- •5.1. Принципы моделирования свойств геологических объектов
- •5.3. Использование автокорреляционных функций для решения геологических задач
- •6. ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ВЫБОР И ЭФФЕКТИВНОСТЬ ИСПОЛЬЗОВАНИЯ МАТЕМАТИЧЕСКИХ МЕТОДОВ
- •6.4. Роль геологического анализа при выборе геолого математической модели
- •7. ПРИМЕНЕНИЕ ЭВМ В ГЕОЛОГИИ
- •7.1. Автоматизация первичной обработки данных
- •7.2. Решение геологических задач с помощью ЭВМ
- •7.3. Автоматизированные системы обработки геологических данных
- •СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
5.МОДЕЛИРОВАНИЕ ГЕОЛОГИЧЕСКИХ ОБЪЕКТОВ
СПОМОЩЬЮ СЛУЧАЙНЫХ ФУНКЦИЙ
5.1.Принципы моделирования свойств геологических объектов
При решении многих геологических задач возникает необхо димость количественной оценки пространственной изменчивости свойств геологических объектов. Методы статистики случайных величин для этих целей малопригодны, так как все статистические модели не учитывают пространственного расположения точек на блюдений. Для оценки пространственной изменчивости геологиче ских признаков может быть использован математический аппарат теории случайных функций, широко применяемый в различных об ластях науки и техники.
Случайной называется такая функция, которая в результате опыта может принять тот или иной конкретный вид, причем какой именно, заранее неизвестно. Аргументами при этом могут быть время (случайные процессы) или координаты пространства (слу чайные поля или последовательности). Случайные процессы ис пользуются в качестве моделей прибрежно-морских гидродинами ческих процессов, для описания сезонных колебаний уровней грун товых вод, при изучении гидродинамических свойств пород, при опытных откачках из скважин и т. п. Гораздо чаще геологу прихо дится иметь дело с моделями случайных полей и последовательно стей, описывающих пространственную изменчивость самых раз личных геологических признаков в одномерном, двумерном или трехмерном пространствах.
Конкретный вид, который принимает функция в результате опыта, называется ее реализацией. Так, например, каротажная диа грамма по скважине может рассматриваться как реализация случай ной функции, описывающей изменение изучаемого физического свойства пород на пробуренном интервале. Совокупность несколь ких контрольных каротажных диаграмм образует семейство или ансамбль реализаций случайной функции. Каждая реализация от ражает общие тенденции в изменении изучаемого свойства, но они
несколько отличаются друг от друга. В данном примере это обу словлено аппаратурными погрешностями, некоторым несовпадени ем точек замеров и другими случайными факторами.
Совокупность значений случайной функции Х{1) при любом фиксированном значении аргумента / называется сечением случай ной функции и является обычной, случайной величиной, то есть такая функция совмещает в себе черты случайной величины и функции. Если зафиксировать значение аргумента, она превраща ется в обычную случайную величину, а отдельная реализация мо жет рассматриваться как обычная (неслучайная) функция.
Модель типа случайной функции, как и статистическая, осно вана на положениях теории вероятностей. Процесс моделирования сводится в конечном итоге к получению выборочных значений и к их статистической оценке путем проверки статистических гипо тез с помощью критериев согласия. При оперировании случайными функциями широко используются основные понятия математиче ской статистики о функциях и моментах распределения, уровнях значимости и доверительных вероятностях событий.
Главными характеристиками случайной функции являются ее математическое ожидание Мдс(/), дисперсия Д(/) и корреляционная функция Кх(1). В отличие от числовых характеристик случайных величин, представляющих собой определенные числа, характери стики случайных функций представляют собой не числа, а функции.
Математическим ожиданием случайной функции Х(Г) называ ется неслучайная функция Мх(/), которая при каждом значении ар гумента / равна математическому ожиданию соответствующего се чения случайной функции. Оценка математического ожидания по ансамблю из N реализаций рассчитывается по формуле
т = ^ х к(1)ш
*=1
и является геометрическим местом точек средних значений изучае мого свойства по сечениям.
Дисперсией случайной функции Х{1) называется неслучайная функция Ас(/), значения которой для каждого / равны дисперсии соответствующего сечения случайной функции. Она характеризует
ширину полосы разброса возможных реализаций случайной функ ции относительно ее математического ожидания. Оценка дисперсии случайной функции рассчитывается по формуле
N - 1
Для описания основных свойств случайной функции математи ческого ожидания и дисперсии недостаточно. Ни одна из данных характеристик не отражает особенностей внутренних связей между отдельными сечениями такой функции. С этой целью используется специальная характеристика-корреляционная функция, отражаю щая степень зависимости между сечениями случайной функции при различных /.
Корреляционной функцией случайной функции Х(1) называется неслучайная функция двух аргументов Я*( (/',/"), которая при каж дой паре значений аргумента равна корреляционному моменту со ответствующих сечений случайной функции
AT,(/',0 = M [i(/W )],
В этом выражении х{1')и х(Г) -значения центрированной слу чайной функции при значениях аргумента /' и /". Центрирование случайной функции осуществляется путем вычитания из значений случайной функции ее математического ожидания
i(/) = JC(/)-M JC(/).
В частном случае, когда оба аргумента случайной функции совпадают, т. е. /' = корреляционная функция Кх(Г,Г) обраща ется в дисперсию случайной функции
При использовании случайных функций для целей геолого математического моделирования геологические объекты рассмат риваются как случайные поля, состоящие из элементарных участ ков, каждый из которых соответствует зоне экстраполяции единич
ного наблюдения. В пределах каждого элементарного участка изу чаемое свойство рассматривается как случайная величина, изме няющаяся относительно некоторого ее среднего значения. Измене ния математических ожиданий и дисперсий этих случайных вели чин можно описать неслучайными функциями координат центров элементарных участков и рассматривать эти функции как матема тическое ожидание и дисперсию случайной функции.
Упорядоченный ряд значений признака, полученных путем оп робования по заданному направлению в определенных точках внут ри данного поля, представляет собой одну из возможных реализа ций случайной функции, аргументом которой является расстояние между точками наблюдений. Группа точечных значений параметра, расположенных в одной плоскости, представляет собой реализацию плоскостного сечения случайного поля, а вся совокупность точеч ных замероводну из его объемных реализаций.
Принципиальная особенность данной модели заключается в том, что она отражает не только специфику природной изменчи вости геологических объектов, но и методику их изучения. Модели одного и того же участка недр, построенные по совокупности экс периментальных данных, могут существенно различаться в зависи мости от объема проб и густоты сети наблюдений. Для описания изменчивости любого свойства практически достаточно знать ха рактеристики случайных функций по трем взаимно ортогональным направлениям, совпадающим с осями анизотропии природных гео логических тел.
Для описания характера изменчивости двумерных дологиче ских полей используют двумерную автокорреляционную функцию
(ДАКФ), которая выражает силу корреляционной связи между зна чениями признака в точках поля, расположенных на разном рас стоянии друг от друга относительно двух координат пространства X
и Y.
Использование аппарата теории случайных функций для реше ния геологических задач сопряжено с рядом сложностей и ограни чений. Главное из них заключается в том, что такая функция, по добно случайной величине, является совокупностью частных реали заций, в то время как результаты геологических наблюдений чаще всего представляют собой одну-единственную реализацию случай
ной функции. Оценка случайной функции по одной реализации возможна только в том случае, если она обладает свойствами ста ционарности и эргодичности. Функции же, характеризующие на блюдаемую изменчивость свойств природных геологических обра зований, как правило, не обладают этими свойствами. Поэтому при использовании моделей типа случайных функций вводится ряд до пущений.
Для расчета важнейших характеристик эмпирических случай ных функций необходимо обеспечить массовость исходных экспе риментальных данных. Поэтому широкое применение модели ра ционально только в тех случаях, когда количество единичных на блюдений достаточно велико, а их плотность обеспечивает отчетливое проявление автокорреляции наблюдаемых значений признака.
Моделирование геологических явлений и процессов является примером дедуктивного метода научного исследования и использу ется для изучения процессов (явлений) по результатам их проявле ний. Модели можно разделить на качественные (понятийные, или концептуальные) и количественные (математические).
Построение качественной модели и выявление главных дви жущих факторов изучаемого геологического процесса или явле ния - очень сложный и ответственный этап. В общем случае по строение качественной модели включает выявление исходных ком понент, главных (определяющих) факторов и результата изучаемого процесса.
Исходные данные имеют сложную структуру. По своему на значению они делятся на три группы: эталонную, прогнозную
и контрольную.
Эталонные данные наиболее представительны и содержат обычно в небольшом объеме исходные данные и соответствующий им результат. Эти данные используются для выявления закономер ностей связи между качественной или математической формами.
Прогнозная группа содержит только исходные данные. Исполь зуя выявленную связь, по эталонным данным и можно прогнозиро вать результат.
Контрольные данные составляют часть эталонной группы; это данные, сознательно не используемые для выявления связи и слу жащие для контроля эффективности модели.
При поисках структур часто возникает необходимость опреде ления характера поведения пласта в разрезе нижней (слабо изучен ной) границы пласта, но на его мощность влияют часто постседиментационные изменения, связанные с последующими размывами и дислоцированностью пород. В зонах размыва мы наблюдаем со кращенную, а на изгибах - увеличенную мощность пласта. Влияние каждого из постседиментационных факторов можно представить в виде количественной модели.
Построим количественную модель на примере качественного соотношения глубин залегания кровли и подошвы пласта.
В качестве исходных данных примем глубину залегания пласта hi, а результатом будем считать глубину на подошве А2; тогда име ем
Л2(х) = Л,(х) + Я ,
где Н —мощность пласта постоянная. Если нет размыва пласта, то
h2(x)<hx(x) +H.
Если по результатам сопоставления удается определить глуби ну размыва ДА, то
Нг(х)> h{(x) + Н.
По данным выражениям можно количественно определить A2(JC) разными методами. В соответствии с ними математические
модели, основанные на законах физики, геометрии и т.д., называ ются детерминированными', модели, использующие вычислитель ный аппарат теории вероятности и математической статистики, - статистическими. В некоторых задачах отсутствие точных дан ных о характере связи между параметрами не позволяет построить детерминированную модель, но не является препятствием для по строения модели статистической.
Одним из наиболее широко используемых при изучении земли многомерных методов является дискриминантный анализ. Мы рас смотрим его по двум причинам: во-первых, он является мощным статистическим методом, во-вторых, его можно поставить в один
ряд с одномерными задачами, поэтому он позволяет установить дополнительную связь между одномерной и многомерной стати стикой.
Предположим, что мы собрали две группы проб сланца, о кото рых заранее известно, что они образовались в пресноводном и мор ском бассейнах (это можно определить на основании исследования ископаемых останков). В пробах измерено некоторое число геохи мических переменных, а именно - содержание ванадия, бора, желе за и т.д. Задача состоит в нахождении такой линейной комбинации этих переменных, которая даст максимально возможное различие между двумя ранее определенными группами. Если нам удастся найти такую функцию, то мы сможем использовать ее для размеще ния новых образцов в той или иной исходной группе. Иными сло вами, новые образцы сланца, не содержащие диагностических ос татков, можно будет разделить на морские и пресноводные на осно ве линейной дискриминантной функции.
Простая линейная дискриминантная функция осуществляет преобразование исходного множества измерений, входящих в вы борку, в единственное дискриминантное число. Это число, или пре образованная переменная, определяет положение образца на пря мой, определенной дискриминантной функцией. Поэтому дискри минация представляет собой «сжатие» многомерной задачи в одномерную.
Основой дискриминантного анализа является нахождение пре образования, которое дает минимум отношения разности много мерных средних значений для некоторой пары групп к многомер ной дисперсии в пределах двух групп. Один из методов нахождения линейной дискриминантной функции - построение уравнения рег рессии, где зависимыми переменными являются разности между многомерными средними значениями двух групп. В матричном
обозначении необходимо решить уравнение вида [&*][A.]= [D ],
где [&^] - т хт матрица дисперсий и ковариаций объединенной
выборки; [к] - вектор-столбец коэффициентов дискриминантной функции; [D] - вектор-столбец разностей между средними значе ниями признаков групп.
Дискриминантную функцию запишем в виде
/? = V , + ^ 2-*2 + - + 4.-*m-
Это линейная функция; суммируя ее слагаемые, получаем чис ло, которое называется дискриминантной меткой:
V _ Л +В.
~ 2 ~ ‘
Подставляя в уравнение дискриминантной функции среднее арифметическое, полученное из средних значений для двух выбо рок, находим значение дискриминантного индекса /?0, который со ответствует точке, разделяющей прямую, и эта точка лежит в точ ности посередине между центром группы А и центром группы В.
Подставление в уравнение многомерного среднего значения А даст нам RA, а многомерного среднего значения В - RB.
Точки, попавшие из группы А в группу В и наоборот, непра вильно расклассифицированы дискриминантной функцией, и полу ченную функцию нельзя применять для классификации новых объ ектов.
Дискриминантная функциия применима при следующих усло виях:
1.Наблюдения в каждой группе выбираются случайно.
2.Вероятно, что неизвестные наблюдения, принадлежащие лю бой из групп, равны между собой.
3.Переменные распределены нормально.
4.Ковариационные матрицы различных групп имеют одинако вый порядок.
5.Ни одно из наблюдений, используемых для построения дис криминантной функции, не было ложно расклассифицировано.
Критерий значимости для дискриминантной функции строится на основании ^-статистики. Производится вычисление «расстоя ния» между двумя многомерными средними значениями, то есть просто вычитаем RAиз /?д, и это расстояние называется расстоянием Махалонобисса, или обобщенным расстоянием D2
Если средние значения двух групп очень близки друг к другу, то их трудно разделить, особенно когда обе группы имеют большой
разброс. Наоборот, если два средних значения легко разделяются и рассеяние вокруг них мало, разделение осуществляется относи
тельно |
просто. Поскольку |
некоторые |
переменные, |
включенные |
в дискриминантный анализ, |
не особенно полезны при отделении |
|||
групп |
друг от друга, |
желательно |
найти эти |
переменные |
и исключить их из дальнейшего рассмотрения.
Математическая статистика использует ряд терминов, заимст вованных из электротехники. Наблюдаемые значения имеют два компонента: основной сигнал, или главную составную часть измен чивости, и случайные помехи, то есть шум. Шум - это короткодей ствующая составляющая, сигнал - наоборот, долгодействующая составляющая исходных данных. Иными словами, последователь ные значения сигнала обычно взаимокоррелированы, тогда как шум в одной точке совсем не зависит от шума в соседних точках. Так как сигнал от точки к точке почти не меняет своего вида, в то время как шум имеет обратную тенденцию, то среднее значение по несколь ким промежуточным точкам стремится к значению только одного сигнала.
Предположим, что измеряется переменная у; каждое измерение будет состоять из сигнала у, и случайной или шумовой компоненты 8/. В качестве оценки сигнала у, в точках наблюдения можно вы брать среднее значение нескольких наблюдений у в соседних точках.
Последовательность оценок у образует более плавную кри вую, чем исходная последовательность у. Поэтому методическая часть называется сглаживанием данных, или фильтрацией.
Наиболее простой способ сглаживания - это метод скользяще го среднего. Сглаживание значения у вычисляют по формуле
j=i~k
т
, т -1
где к = —-—;
т - длина интервала, в котором производится сглаживание, или число точек, по которым вычисляются средние значения.
5.2.Использование энтропии для решения задач
внефтяной геологии
Разрабатываемые системы количественных показателей долж ны охватывать не только отдельные геологические явления и объек ты, различные их свойства и признаки, но и естественные сочетания объектов и явлений, образующие системы. Эта задача является осо бенно трудной.
Теория информации используется во многих случаях для реше ния задач, общих с математической статистикой, и отличается од ним активным свойством: несмотря на разнообразие, стремится вы яснить, чего можно достичь именно благодаря разнообразию.
Одним из основных понятий, которыми оперирует теория ин формации, является энтропия. Энтропия - это внесение хаоса в упорядоченную систему. Ее можно рассматривать не только как меру неопределенности наших знаний относительно системы собы тий, но и как меру разнообразия самой этой системы.
Для дискретной системы событий энтропию можно вычислить по формуле Шеннона
H =-^P(i)logP(i),
/
где P(i) - вероятность наступления события / в изучаемой системе. Вычисление значений энтропии отличается простотой, особен
но при использовании данных, приведенных в специальных табли цах, и вся операция в этом случае сводится к суммированию таб личных значений.
Энтропия как мера неоднородности лишена многих недостат ков, присущих дисперсии, коэффициенту вариации; ее размерность зависит только от выбранного основания логарифмов; она не связа на с величиной среднего значения и более полно, чем дисперсия, характеризует асимметричные и сложные виды распределения. При нормальном распределении и использовании натуральных лога рифмов энтропия связана с сг-зависимостью:
И(х) = 0,916 + 1п-^-, Ах
где Ах - величина классового интервала, которую определяют по формуле Стерджеса: