
мат. модел в почв
.pdf
Часть II. Применение математических моделей в почвоведении
И это дает возможность объяснить к чему может привести изменение того или иного параметра, или вследствие чего, каких процессов этот параметр изменился. В этом случае, когда уравне ние получено на основании рассмотрения физических законо мерностей, параметры нелинейной регрессии могут иметь не только физическое обоснование, но и размерность. Конечно, это уже понимание процессов, чего и требует математическое моде лирование.
Или, например, в работе А.В. Смагина, описание запасов гу муса в профиле черноземов производилось с помощью комбина ции двух экспоненциальных функций типа C(z)=A exp(–mz)+B exp(– bz)+C0, где A, B, C и m, b – параметры аппроксимации распределе ния органического вещества по глубине профиля чернозема (z). Приведенное уравнение, по сути, представляет собой полином с использованием экспоненциальных функций. Используя указан ную аппроксимацию и анализируя параметры модели, А.В. Сма гин приходит к очень интересным выводам. В частности, расчет модельной динамики запасов гумуса показывает, что за 100–200 летний период эксплуатации черноземные почвы теряют от 30 до 85 т/га органического вещества. В дальнейшем, процесс замедля ется, но со временем деградация затрагивает все более глубокие слои почвы. Характерный для черноземов максимум содержания органического вещества смещается с глубины 5–10 см до 40 см и постепенно сглаживается.
Заметим, что это результат моделирования, точнее, исполь зования полиномов для описания пространственного внутрипро фильного распределения свойств почвы. Возможно, что это опре деленный метод анализа профильных распределений, поиска за кономерностей и, возможно, предсказания процессов с помощью полиномиальных функций. Использование этого метода находит широкое применение, в частности, при анализе профильного рас пределения параметров поровой структуры почв и в ряде других исследований. Подчеркнем, в данном случае рассмотрен лишь метод анализа изменения того или иного свойства по профилю и поиск с его помощью пространственных внутрипочвенных зако
261

Математическое моделирование в почвоведении
номерностей. Это метод перспективен, но лишь при строгом учете всех условий аппроксимации и возможном снижения числа пара метров.
Все указанные процедуры легко проводятся в стандартных пакетах STATISTICA, SIGMAPLOT и в некоторых других. Надо быть внимательным при их использовании и аккуратно разбираться со статистической выдачей результатов, на основании которых и де лается выбор и выводы.
Сплайн функция
Сплайн функция не имеет конкретного математического вы ражения, это кусочно заданная функция, для каждого отрезка ко торой подбирается свой вид полинома 3 й или более высокой степени, описывающий прохождение кривой через многочислен ные экстремумы. Этот вид функции используется при моделиро вании различных поверхностей, в т.ч. при картографировании (го ризонтали на картографических картах). Однако для других целей применение этой функции ограничено, т.к. физического смысла такой вид зависимости не имеет и последующая (после аппрок симации экспериментальных данных сплайн функцией) физиче ская интерпретация такого рода аппроксимации невозможна.
Не всегда можно подобрать к экспериментальным данным некую простую по форме зависимость, например, при действии на экосистему нескольких внешних факторов. В этом случае при ходится иметь дело со сложными полиномиальными функциями с множеством параметров. Но так ли уж важны для целей адек ватного моделирования все коэффициенты в таких непростых случаях. С большой долей вероятности можно утверждать, что не все параметры имеют физический смысл, а соответственно зна чимо влияют на результат моделирования. Для упрощения слож ных функций в таких случаях применяется процедура элиминиро вания параметров. (см. раздел 3.3. «Элиминирование парамет ров»)
262

Часть II. Применение математических моделей в почвоведении
3.3. Элиминирование параметров аппроксимации
Например, в практике экспериментальных исследований очень часто определяют кривую сорбции (десорбции) паров воды почвами, – довольно стандартный для физики почв анализ. Полу чаются весьма разнообразные, но в целом характерные S образные кривые (рис. II.3.11).
Рис. II.3.11. Примеры кривых сорбции паров воды для различных поч венных объектов («Полевые и лабораторные методы исследования свойств и режимов почв», 2001)
Естественно, S образный вид кривых сорбции предполагает единую функцию для описания этого явления. Однако, из литера туры известно, что единого уравнения для описания этого явле ния не существует. Большинство предлагаемых уравнений при менимо к отдельным частям изотерм сорбции паров воды почва ми (это уравнении БЭТ, Ленгмюра, Фаррера и др.) и не в состоя нии описать изотермы во всем интервале относительных давле ний 0<p/p0<1. Однако, была необходимость предложить модель для диапазона относительных давлений паров 0.1<p/p0<1 и ис пользовать её для конкретных почв. Как поступить в этом случае?
263

Математическое моделирование в почвоведении
Вот как было предложено это сделать Г.В. Харитоновой. Разберем этот случай в качестве примера процедуры элиминирования па раметров.
Элиминирование (от лат. elimino — выношу за порог, изго няю) – исключение из уравнения аппроксимации параметров, не имеющих существенного значения, повышающего дос товрность уравнения, и за счет этого, упрощение вида зави симости.
Г.В. Харитонова (Харитонова др., 2012) использовала общий прием: сначала был подобран полином высокой степени (напри мер, 6 й), а затем были удалены (элиминированы) некоторые со ставляющие полинома без потери качества описания им экспе риментальных данных. Для описания изотерм сорбции паров во ды почвами зависимостью вида W = f(p/p0), где W – влажность, % от массы сухой почвы; p/p0 – относительное давление паров воды, за основу было принято уравнение
W =C0 +C1 (p / p0 ) +C2 (p / p0 )2 +C3 (p / p0 )3 +... +Cn (p / p0 )n ,
как наиболее соответствующее изотермам сорбции на всем их протяжении.
С возрастанием n от 1 до 8 для полученного массива данных коэффициент детерминации R2 или оценка корреляции фактиче ских значений с моделью возрастает и приближается к величинам близким 1 при n = 6–8. Среднее значение коэффициента детер минации R2, вычисленное при n = 6 составило R2=0.996 – 0.999. Стандартная ошибка оценки влажности Sw по модели (Sey – стан дартная ошибка для оценки y) с возрастанием n от 1 до 6 суще ственно уменьшается. Статистическая значимость указанного по
линома проверялась по критерию Фишера F |
= S2 |
|
/ S2 |
, где |
|
|
регрессии |
рег |
ост |
|
|
S2 |
– дисперсия, обусловленная использованием |
полинома; |
|||
рег |
|
|
|
|
|
– остаточная дисперсия, т.е. дисперсия, связанная с ошибка ми наших измерений (Химмельблау, 1973). F критерий для рег
264

Часть II. Применение математических моделей в почвоведении
рессии варьировал в интервале 200–3000, что много больше, чем Fтаб = 5–10 при принятом уровне значимости α = 0.05. Следова тельно, на основании статистической значимости регрессии мож но принять n = 6.
Окончательный вид уравнения связи влажности и относи тельного давления паров воды для изотерм сорбции был выбран согласно следующим критериям: численное совпадение экспери ментальных и расчетных данных, минимизация числа факторов модели на основании анализа критерия Фишера и согласие пара метров модели с измеряемыми величинами. Выбор «наилучше го» уравнения регрессии проводился методом исключения, со гласно которому элиминирование предикторной переменной проводится на основании величины ее частного F критерия (Дрейпер, Смит, 1987). Если наименьшая величина частного F критерия меньше заранее выбранного критического значения F, то переменная исключается из рассмотрения. Далее производит ся перерасчет уравнения регрессии с учетом остающихся пере менных и переход к следующему шагу, если новое уравнение регрессии статистически значимо (сравнение Fрег и Fтаб при задан ном уровне значимости α) и значение R2 сохраняется на прежнем уровне.
Этим критериям удовлетворяет уравнение
W = A(p p0 ) +B(p p0 )3 +C(p p0 )6 +D ,
где W – влажность, % от массы сухой почвы; p/p0 – относительное давление паров воды; А, В, С и D – расчетные коэффициенты. Анализ величин А, В, С и D (таблица II.3.1) показал, что коэффици енты уравнения или параметры модели сравнимы с влажностями изотерм по величине, при этом коэффициент А близок величине максимальной гигроскопической влажности Wмг, которая отно сится к числу почвенно гидрологических констант. F критерий для регрессии варьировал в интервале 140–2200, что свидетельствует о возможности использования полученного уравнения для описа
265

Математическое моделирование в почвоведении
ния изотерм сорбции паров воды почвами в интервале относи тельных давлений водяного пара 0.1< p/p0<0.98.
Табл. II.3.1
Коэффициенты A, B, C и D уравнения при сорбционно статическомопределении изотерм адсорбции паров воды почвами (Харитонова, Шеин, Воронов, 2012)
Горизонт, |
A |
B |
C |
D |
r2 |
Sw |
глубина, см |
|
|
|
|
|
|
Дерново |
сильноподзолистая легкосуглинистая почва |
|
||||
Ad 0 – 2 |
4.91 |
4.73 |
4.96 |
0.42 |
0.992 |
0.14 |
Итак, процедура элиминирования основана на сравнении ап проксимаций с различным количеством параметров с помощью критерия Фишера F. Еще раз напомним, что в статистике критерий Фишера используют для сравнения дисперсий двух выборок:
|
F = |
σ |
2 |
(H0: σ |
2 =σ 2 ), |
|
|
1 |
2 |
||||
|
|
σ |
|
1 |
2 |
|
|
|
2 |
|
|
|
|
где σ 2 |
– большая дисперсия, |
σ 2 |
– меньшая дисперсия. |
|||
1 |
|
|
|
2 |
|
|
Если для определенного уровня значимости и соответствую щих чисел степеней свободы для первой и второй выборок вы численное значение критерия F больше табличного, то нулевая гипотеза равенства дисперсий (H0: σ12 =σ22 ) отвергается, а дис персии считаются различными. При оценке сложного влияния фактора на функцию отклика (в данном случае на влажность) можно статистически грамотно записать: y = b1 +b2 x +...bn xn + s ,
где s – ошибки. Указанные ошибки относятся к результатам изме рения наших аргументов, они также являются составной частью модели. Эти ошибки тоже имеют свою дисперсию, σs , и модель при своем использовании дает некоторые ошибки, σм. Поэтому можно использовать вышеприведенное дисперсионное отноше ние F или критерий Фишера для характеристики качества нашей модели. Действительно, мы используем средние значения аргу мента и функции отклика и поочередно проверяем насколько эти аргументы сильно влияют на функцию отклика с учетом вариа
266

Часть II. Применение математических моделей в почвоведении
бельности. Вот для этого и используется критерий Фишера. На помним, что критерий Фишера F – односторонний и как каждый статистический критерий имеет в своей основе нулевую гипотезу. В данном случае нулевая гипотеза формулируется как равенство выборочных (т.е. экспериментальной и модельной) дисперсий, σм= σs. И если отношение выборочных дисперсий не превышает табличного значения F, то с заданной вероятностью и соответст вующей степенью свободы нулевая гипотеза не отвергается. Это значит, что различия между сравниваемыми дисперсиями недос товерны. Значит и наше уравнение может при указанной вероят ности считаться недостоверным. Но если рассчитанное отноше ние оказывается больше критического, то с соответствующей ве роятностью принимается альтернативная гипотеза, т.е. дисперсии неодинаковы – дисперсия наших измерений больше, чем диспер сия ошибок модели, и в этом случае мы имеем право использо вать модель при данном уровне значимости.
Тот же принцип используется и для исключения параметров из уравнения аппроксимации. Так, если в результате исследова ния была подобрана некоторая зависимость (в нашем примере – это был полином 6 й степени), нулевая гипотеза в этом случае ис ходит из того, что дисперсии экспериментальная и обусловленная моделью не различаются. Следовательно, модель является не достоверной. Если же вычисленное значение критерия F больше, чем значение табличное (для соответствующего уровня значимо сти и степеней свободы), это означает, что нулевая гипотеза не верна, а данное уравнение действительно объясняет исследуе мое явление. Так и получилось, когда использовался полином 6 й степени. Далее необходимо упростить найденную зависимость с помощью процедуры элиминирования путем сравнения диспер сий изначального уравнения и уравнения с исключением одного из параметров. Если критерий покажет значимость новой зависи мости и более того, критерий F возрастет, следовательно, исклю ченный параметр не имел существенного влияния и для целей аппроксимации его можно опустить.
267

Математическое моделирование в почвоведении
В результате, поочередного исключения параметров, анализа критериев Фишера и проверки качества полученного нового уравнение по R2, и было получено уравнение для характеристики процесса сорбции паров почвами, имеющее всего четыре пара метра (вместо начальных семи): А, B, C и D: W = A(p/p0) + B(p/p0)3 +
C(p/p0)6 + D.
Строго говоря, метод элиминирования параметров применя ется более часто и точно при иной организации выборки, или ином построении эксперимента. Так, мы использовали принцип построения эксперимента, когда следили за переменной отклика при активном изменении фактора и находили между ними соот ветствие. Это классический физический эксперимент. Но выборка может быть построена и по другому: мы можем следить за пере менной отклика, которая формируется при воздействии множест ва природных факторов и на этом основании построить множест венную полиномиальную модель. В этом случае также правомер но будет использовать метод элиминирования для упрощения и подробного анализа модели. Более того, появится возможность вычленить наиболее «весомые» значимые факторы предикторы модели. Таким способом формируются выборки при мониторин говых наблюдениях, когда надо следить за важной переменной отклика при вариабельности (временной, пространственной) раз личных факторов. Именно так поступают, когда выясняют значи мость влияния отдельных факторов окружающей среды на со стояние здоровья населения. Это иной способ построения выбор ки данных, для которого применение метода элиминирования параметров считается более обоснованным.
Заканчивая раздел «Основные функциональные зависимости, используемые в естествознании, их классификация» необходимо остановиться на том, как же подбирать функции для описания экспериментальных данных. Ещё раз напомним функции, которые помогут вам ускорить их выбор для описания экспериментальных данныхввашемконкретномисследовании (таблицаII.3.2).
268
