Биостат - помощь / Учебники / Ивантер Коросов Введение в количественную биологию
.pdf
260 |
Имитационное моделирование |
ячейки которой заполнены формулами, имитирующими либо выборку вариант (статические модели), либо ход процесса (динамические модели). Каждая ячейка содержит формулу, которая вычисляет соответствующее «модельное» значение варианты или характеристику системы на очередном временнó м шагу. Поскольку «объяснительные» значения модельных переменных должны более или менее совпадать с реальными наблюдениями, организуется процедура поиска таких (оптимальных) значений модельных параметров, которые делают отличия между моделью и реальностью наименьшими, минимизируют «функцию отличий» («невязку»). Эта процедура оптимизации выполняется с помощью отдельной программы «Поиск решения», встроенной в пакет Excel. (Ответственное отношение к моделированию требует понимания существа процедуры настройки! (см.: Коросов, 2002).)
Помимо программирования самой модели и настройки ее параметров требуется доказать значимость модельных параметров, адекватность модели. Для решения этой задачи на листе Excel приходится конструировать целую имитационную систему, состоящую из следующих компонентов:
∙блок исходных данных, зачастую состоящий из массива независимых и зависимых переменных;
∙блок расчета модельных данных, собственно имитационная модель, состоящая из уравнений; осуществляет расчет явных переменных и скрытых переменных;
∙блок параметров, участвующих в расчете модельных данных и изменяемых в процессе настройки;
∙блок расчета отличий реальных и расчетных значений переменных;
∙значение суммы отличий между моделью и реальностью (значение функции невязки); оно минимизируется в процессе настройки;
∙блок процедуры настройки (программа «Поиск решения»);
∙блок графического представления результатов;
∙блок статистической оценки результатов.
Врезультате несложных действий мы получаем очень гибкий инструмент описания действительности. В потенциях имитационной модели стать сложной и детализированной или, напротив, простой и обобщающей, выражающей законы, управляющие миром.
Имитационное моделирование |
261 |
Задача аппроксимации данных (статические модели)
Статические модели похожи на регрессионные; они выполняют расчет модельных значений, опираясь на исходные реальные выборочные данные. Меняется лишь процедура расчета модельных параметров (коэффициентов в уравнениях) – вместо метода наименьших квадратов используется итеративная процедура подгонки результатов счета под исходные значения. Вследствие этого расширяются возможности для аппроксимации любых зависимостей, возможности для описания наблюдаемых явлений с помощью уравнений самого разного вида и сложности, снимаются ограничения на пропуски в данных, а для случая криволинейных зависимостей результаты расчетов уточняются.
Моделирование – это не только инструмент преобразования нагромождения фактов в емкую модельную формулу. Более интересна возможность анализировать сложное явление, представляя его как объединение более простых взаимодействующих компонентов. С помощью имитационной модели любая сложная кривая зависимости может быть представлена как сумма более простых кривых, параметры уравнений которых приобретают биологический смысл. Одна из часто встречающихся сложных кривых – параболическая зависимость. Многие явления в жизни природы подчинены цикличности, когда постепенное увеличение уровня изучаемого признака сменяется плавным его падением. При этом за восходящую ветку кривой, как правило, ответственны одни процессы, а за нисходящую
– другие (смертность). Результирующая параболическая кривая оказывается следствием синтеза двух противоположных тенденций.
Рассмотрим пример модельного исследования одного сложного процесса – изменения плодовитости рачка дафнии (Daphnia magna Straus) во все возрастающих концентрациях лигнина, основного компонента сточных вод целлюлозно-бумажных комбинатов (Калинкина, 1993). Опыт состоял в следующем. Дафний одного возраста (7 дней) помещали в растворы с разными концентрациями лигнина. Ежедневно в течение месяца собирали живую молодь. Графическое изображение результатов опыта представляет собой близкую к параболической зависимость плодовитости дафний (Е) от все возрастающих концентраций лигнина ([Lig]) (рис. 10.1).
262 |
Имитационное моделирование |
|
|||
E |
|
|
|
|
|
150 |
|
|
|
|
|
100 |
|
|
|
|
|
50 |
|
|
|
|
|
|
|
E |
|
|
|
0 |
|
|
|
|
[Lig] |
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
250 |
Рис. 10.1. Зависимость плодовитости дафний (Е) |
|||||
|
|
от лигнина ([Lig]) |
|
|
|
Сначала решим простую задачу аппроксимации (приблизительного описания) исходных данных параболической кривой.
Введем на лист Excel данные, названия переменных (включая модельную плодовитость), а также обозначения и предварительные значения параметров (a, b, c), коэффициентов уравнения. Следующая задача состоит в том, чтобы по формуле параболы рассчитать теоретические значения плодовитости (Emod), соответствующие данным концентрациям лигнина: E = a·[Lig]²+ b·[Lig] + c.
Введем эту формулу в ячейку C3 для расчета первого модельного значения. На листе Excel она представляет собой набор
Имитационное моделирование |
263 |
ссылок, во-первых, на ячейки, содержащие значения аргументов (столбец A), во-вторых, на ячейки, содержащие значения параметров модели ($F$3, $F$4, $F$5). Ссылки на параметры должны быть абсолютными (содержать префиксы $), поскольку в расчетах разных значений модели используются одни и те же значения параметров.
Далее следует скопировать введенную формулу в остальные ячейки, например, с помощью операции «автозаполнение». Для этого нужно навести мышь на правый нижний угол выделенной ячейки с формулой, чтобы появился курсор в виде черного крестика,
и, нажав левую кнопку, «протянуть» выделение по нескольким ячейкам (C3:C7). Весь блок заполнится модельными формулами.
264 |
Имитационное моделирование |
Правильность формул легко проверить, щелкнув мышкой на любой ячейке блока и нажав функциональную клавишу F2; так же выверяется правильность ссылок.
Рассчитанные значения плодовитости (от 1 до 40201) сильно отличаются от реальных; предварительно заданные параметры явно не подходят. Для «настройки» модели на действительность необходимо рассчитать обобщенное отличие между ними; этой цели служит сумма квадратов разности между всеми значениями. Вводим формулу определения различий: ф = (xmod – x)².
Автозаполнив ею ячейки блока D3:D7, рассчитаем суммарное отличие Ф, например, в ячейке F2 =СУММ(D3:D7).
Имитационное моделирование |
265 |
|
|
|
|
Теперь можно провести настройку модели, изменяя ее параметры с помощью макроса оптимизации, который вызывается командой меню Сервис\ Поиск решения.
Впоявившемся окне нужно с помощью мыши:
-Установить целевую ячейку (с суммой разности квадратов),
-Равной значению 0,
-Изменяя ячейки (со значениями параметров).
После этого нажать кнопку Выполнить, и в появившемся окне Результаты поиска решения выбрать Сохранить результаты и рассмотреть их.
266 |
Имитационное моделирование |
|
|
|
|
Итак, для описания эмпирической зависимости настройка предлагает следующие коэффициенты модели (рис. 10.2):
Emod = –0.007 ·[Lig]²+ 1.1234·[Lig] + 94.22. 7
E |
|
|
|
|
100 |
|
|
|
|
|
|
E |
|
|
|
|
Emod |
|
|
0 |
|
|
|
[Lig] |
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
Рис. 10.2. Модель зависимости плодовитости (Е) от лигнина ([Lig])
Корреляция между реальными и модельными значениями составила: rE,Emod = 0.953. Полученная модель хорошо описывает правые точки (50– 200 мг/л), но для небольших концентраций (5 мг/л) ее прогноз оказался заниженным (100 против 115 экз.).
Такое же уравнение в среде Excel можно построить с помощью программы «Добавить линию тренда».
Преимущество имитационных моделей перед описательными регрессионными состоит в том, что они с легкостью могут послужить средством анализа сложной зависимости, разложения ее на составные компоненты, т. е. для получения моделей, более понятных и адекватных исходным данным.
Имитационное моделирование |
267 |
Продолжим исследование реакции дафний на лигнин с помощью имитационного моделирования с целью объяснить существо наблюдаемого процесса.
Помимо регистрации живой молоди проводились и другие наблюдения. В частности, в высоких концентрациях на дне сосудов наблюдались скопления останков (карапаксов) погибшей молоди, не вошедшей в учет. Кроме того, к концу опытов даже невооруженным глазом было видно, что дафнии в контроле существенно мельче дафний из опытных сред.
Эти наблюдения позволяют определить два возможных фактора, ответственных за изменение плодовитости. Во-первых, лигнин явно стимулировал рост животных и крупные особи стали давать больше молоди; для Cladocera это явление широко известно. Во-вто- рых, в высоких концентрациях лигнина возросла смертность новорожденных, что и снизило общую плодовитость; этот эффект также обычен для интоксицированных дафний.
Параболическая кривая плодовитости, следовательно, образована обобщением двух простых монотонно возрастающих кривых: это рост потенциальной плодовитости с ростом размеров тела и рост смертности молоди в возрастающих концентрациях лигнина. Определение параметров этих уравнений и составляет очередную задачу моделирования.
Решить ее можно даже в отсутствие данных по размерам тела, напрямую связав рост плодовитости рачков с увеличением концентрации лигнина (мг/л). Тогда модель должна быть представлена тремя уравнениями:
–связь потенциальной плодовитости (экз./самку/30 дней) и размеров тела, зависящих от концентрации лигнина: Ep = a×[Lig] b,
–зависимость смертности от концентрации лигнина: Ed = c×[Lig] d,
–результирующая, наблюдаемая плодовитость: Emod = Ep – Ed,
где a, b, c, d – модельные параметры.
Здесь две модельные переменные, потенциальная плодовитость (Ep) и смертность (Ed), оказываются скрытыми (латентными), они используются для расчета одной явной переменной – результирующей плодовитости (Emod). При этом обе скрытые переменные определяются одной общей для них независимой переменной [Lig].
268 |
Имитационное моделирование |
Имитационную систему на листе Excel следует дополнить этими уравнениями (табл. 10.1), которые в формате Excel примут такой вид (например, для ряда 4):
C4 =$H$3*A4^$H$4,
D4 =$H$5*A4^$H$6, E4 =C4-D4.
Таблица 10.1
Для того чтобы модельные уравнения правильно отображали тенденции изменения соответствующих переменных, значения их параметров необходимо задать, хотя бы приблизительно, еще перед настройкой (метод биологического правдоподобия). Так, рост плодовитости может начаться только со значения 81 экз. (плодовитость в контроле); примем начальную величину первого параметра на уровне a = 80. Поскольку рост плодовитости идет не очень интенсивно, примем степенной параметр равным b = 0.1 (с этими параметрами первые значения потенциальной и реальной плодовитости почти совпадут). Смертность, в отличие от плодовитости, напротив, возрастает очень резко (примем d = 2), начавшись с низкого уровня (например, c = 0.01). Подставив эти примерные величины параметров в имитационную систему, получим приблизительное описание изменения плодовитости дафний в разных концентрациях раствора.
Далее, используя макрос оптимизации («Поиск решения»), удается получить хорошее решение, тесное совпадение модельных и реальных данных (табл. 10.2, рис. 10.3).
Имитационное моделирование |
269 |
Таблица 10.2
E |
|
|
|
|
|
150 |
|
|
|
|
|
|
|
|
|
|
E |
100 |
|
|
|
|
Ep |
|
|
|
|
Ed |
|
|
|
|
|
|
|
|
|
|
|
|
Emod |
50 |
|
|
|
|
|
0 |
|
|
|
|
[Lig] |
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
250 |
Рис. 10.3. Рост потенциальной плодовитости и смертности |
|||||
молоди в возрастающих концентрациях лигнина. |
|||||
Корреляция между реальными и модельными значениями составила: rE,Emod = 0.996, стала немного выше, чем для первой модели. Новая модель в целом лучше описывает процесс, в частности, Emod ближе к E для низких концентраций. Объясняется это тем, что «ответственность» за восхождение и падение кривой общей плодовитости разделили между собой два уравнения, которые с помощью разных наборов параметров описывают частные механизмы изучаемого явления.
