Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1komarov_a_s_red_matematicheskoe_modelirovanie_v_ekologii.pdf
Скачиваний:
17
Добавлен:
19.11.2019
Размер:
6.5 Mб
Скачать

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

АНАЛИЗ ПРИМЕНЕНИЯ КРИТЕРИЕВ СОГЛАСИЯ ДЛЯ АНАЛИЗА БИОЛОГИЧЕСКИХ ДАННЫХ С ПОМОЩЬЮ ПАКЕТА BIOSYSTEM OFFICE

Петросян В.Г., Бессонов С.А., Дергунова Н.Н., Омельченко А.В.

Институт проблем экологии и эволюции им. А.Н. Северцова РАН, Москва, Россия petrosyan@sevin.ru

Аннотация: Представлен сравнительный анализ мощности статистических критериев согласия, предназначенных для анализа номинальных, порядковых, интервальных данных и данных отношений с использованием пакета программ Biosystem office. Показано, что критерии Пирсона и Ватсона являются наиболее мощными для анализа номинальных, порядковых и сгруппированных данных, а Андерсона-Дарлинга и Шапиро-Уилка для анализа непрерывных данных. Рассмотрены функциональные возможности Biosystem office для решения типовых задач по анализу биологических данных.

Введение

В 2002 г. в России был разработан отечественный стандарт ГОСТ Р ИСО 5479–2002, который является аналогом международного стандарта ISO 5479–97» (ГОСТ Р ИСО 5479, 2002). Хотя этот стандарт, включает многие параметрические и непараметрические критерии согласия, тем не менее, он не охватывает значительную часть критериев, которые используются во всем мире. В настоящее время в статистической литературе имеются около 40 популярных тестов согласия (Dufour и др., 1998, Лемешко, 2005). Первый из них был

предложен в 1895 г. К. Пирсоном(χ2). Этот критерий сейчас также широко используются изза его универсальности - он приложим к дискретным и непрерывным распределениям, одномерным и многомерным данным. Из всех критериев важное место занимают критерии проверки нормальности. Принадлежность экспериментальных данных нормальному закону является необходимой предпосылкой для корректного применения большинства классических методов математической статистики. Например, предположение нормальности лежит в основе многих статистических процедур, таких как t-тесты, дисперсионный, линейный регрессионный и дискриминантный анализ. При нарушении этого предположения применение классического аппарата может приводить к неверным выводам. Наш анализ позволяет утверждать, что ограниченность набора критериев, включенных в стандарт без должного анализа, не позволяет пользователям выбрать наиболее предпочтительный критерий для применения в зависимости от альтернативных гипотез, объемов выборок и принятого уровня мощности критериев. Хотя некоторые недостатки и преимущества популярных критериев достаточно подробно рассмотрены в литературе, тем менее ответы на многие вопросы, указанные выше в современной литературе отсутствуют.

Основная цель работы – комплексный сравнительный анализ критериев согласия, применяемых для номинальных, порядковых, интервальных данных и данных отношений, а также разработка рекомендаций по их применению для анализа биологических данных с использованием оригинального пакета Biosystem office.

Методика исследований

Анализ сравнения мощности критериев согласия Пирсона (χ2), КолмогороваСмирнова(Dmaх), Крамера-фон Мизеса-Смирнова (Wd ), Ватсона (Ud ) и Андерсона –

Дарлинга ( Ad ) для дискретных данных был проведен на примере проверки простой гипотезы

равномерности при следующих альтернативных распределениях – монотонновозрастающего, ступенчатого, треугольного, плосковершинного, островершинного и бимодального. В процессе вычислительных экспериментов использовали выборки с

149

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

размерами N=10, 20, 30, 50, 100, 200. Анализ критериев согласия Фросини (Fr), ШапироУилка(SW), Колмогорова-Смирнова(D), Купера, (V), Крамера фон-Мизеса – Смирнова(W),

Ватсона(U), Андерсона-Дарлинга(A), Пирсона (χ2) для непрерывных данных проведен на примере проверки на нормальность для трех типов альтернативных распределений H1(обобщённое нормальное распределение), H2(распределение Лапласа), H3 (логистическое распределение). Размеры выборок составляли 10, 20, 30, 40, 50, 100, 200, 300. Для сравнения мощностей использовались N=105 случайных выборок для непрерывных и дискретных данных соответственно сгенерированных из 9 вышеуказанных типов распределений. Проверка гипотез проводилась для уровней значимости α = 0.05 и α = 0.1. Для итоговой оценки мощности критериев использовалась следующая процедура ранжирования. Ранг 1 получает критерий с наивысшей мощностью, в то время как ранг 8 (для непрерывных данных) или 5 (для дискретных данных) были даны критериям, которые имели самые низкие мощности. Эти ранги для каждого критерия с учетом размеров выборок и уровней значимости затем суммировались для получения общего итогового ранга. Поскольку наименьший ранг был присвоен критерию с наибольшей мощностью, поэтому критерий, который имеет низкий общий ранг, считается как наилучший тест проверки нулевой гипотезы. Статистический анализ выполнен с помощью пакета программ Biosystem office (Петросян, 2014).

Анализ результатов

Анализ мощности критериев для дискретных данных показал, что хотя не существуют критериев, которые можно предложить в качестве наилучшего, тем не менее, установлено, что критерии Андерсона – Дарлинга является наиболее мощным для монотонно возрастающего альтернативного распределения, Крамера-фон Мизеса-Смирнова и Колмогорова-Смирнова - для ступенчатого распределения, Ватсона - для треугольного, плосковершинного и островершинного типов распределений, а критерии Пирсона - для бимодального распределения. Анализ критериев, предназначенных для непрерывных данных показал, что среди 8 рассмотренных тестов критерии Андерсона-Дарлинга и Шапиро-Уилка являются наиболее мощными критериями для различных типов альтернативных распределений и размеров выборок, тогда как критерии Колмогорова-Смирнова и Пирсона являются наименее мощными. На рисунке 1 представлен суммарный ранг мощности сравниваемых критериев, используемых для разных типов данных.

Рисунок 1. Суммарный ранг мощности 8 критериев согласия для непрерывных данных (a) и 5 критериев для дискретных данных (б) при проверке на нормальность и равномерность соответственно при 9 альтернативных распределениях (где по оси Y-ранг, X-критерии).

Наши исследования, а также другие литературные данные показывают, что мощность критериев нормальности достаточно низка для небольших размеров выборки (30 и ниже).

150

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

Работа выполнялась при финансовой поддержке гранта РФФИ № 15-04-06423 и программы ОБН РАН «Рациональное использование биологических ресурсов России: Фундаментальные основы управления».

Литература

ГОСТ Р ИСО 5479–2002. Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения. – М. : Изд-во стандартов, 2002. – 30 с.

Dufour J.M., Farhat A., Gardiol L., Khalaf L. Simulation-based Finite Sample Normality Tests in Linear Regressions. Econometrics Journal. 1998. Vol. 1, pp. 154-173.

Лемешко Б. Ю., Лемешко С. Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона / // Метрология. – 2005. – № 2. – С. 3–24.

Петросян В. Г. Интегрированная система управления базами данных и статистического анализ биологических данных - Biosystem office. Федеральная служба по интеллектуальной собственности, Номер свидетельства2014663194, Дата регистрации – 18 декабря 2014г.

(http://www1.fips.ru/fips_servl/fips_servlet?DB=EVM &DocNumber=2014663194&TypeFile=html)

151

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

ОСНОВНЫЕ СТРУКТУРНЫЕ ОСОБЕННОСТИ МОДЕЛИ ЭКОСИСТЕМЫ ЗОНЫ АПВЕЛЛИНГА РАЙОНА ЦЕНТРАЛЬНО-ВОСТОЧНОЙ АТЛАНТИКИ

Подгорный К.А.

Федеральное государственное бюджетное научное учреждение «Атлантический научноисследовательский институт рыбного хозяйства и океанографии», г. Калининград, Россия kapborok@mail.ru

Аннотация: Построение моделей водных экосистем, в которых необходимо осуществить сопряжение гидрохимических и биологических процессов, происходящих на нескольких трофических уровнях, представляет значительные трудности. В данной работе рассмотрен подход к построению имитационной модели экосистемы зоны апвеллинга района ЦВА, которая позволяет исследовать пространственно-временную динамику и структуру многовидового сообщества рыб.

В структурном отношении модель экосистемы зоны апвеллинга района ЦВА будет состоять из нескольких базовых блоков. Основное внимание на данном этапе работы уделено описанию наиболее важных структурных особенностей биологического блока модели экосистемы зоны апвеллинга района ЦВА – пространственно однородной подмодели N–P–Z– D–Fishes. Учет пространственных эффектов потребует применения трехмерного термогидродинамического блока, который необходим для расчета пространственновременной структуры течений, тепловых потоков в приводном слое атмосферы, температуры, солености и плотности воды, корректного описания процессов переноса растворенных и взвешенных веществ, а также миграций рыб. На сегодняшний день в качестве трехмерной гидродинамической модели для расчета пространственно-временной структуры течений в зонах апвеллинга наиболее широкое практическое распространение получила модель ROMS (The Regional Oceanic Modeling System). Выбор достаточно простой по структуре четырехкомпонентной модели планктонной системы (N–P–Z–D-модели (Подгорный, 2012)) обусловлен качеством и количеством тех данных гидрохимических и гидробиологических наблюдений, которые в настоящий момент времени имеются в базе данных АтлантНИРО.

Теоретической основой при выборе структуры и построении многовидовой модели N– P–Z–D–Fishes, которая описывает основные процессы в экосистеме зоны апвеллинга района ЦВА, послужили работы (Fennel, 2008; Fennel, 2009) и имеющийся некоторый опыт практического использования данного подхода (Fennel, 2010; Radtke et al., 2013). Модельная структура пищевой цепи рыб в районе зоны апвеллинга ЦВА, которая показана на рисунке 1, была выбрана по результатам исследований, обобщенных в работе (Доманевский, 1998).

Переменные состояния модели для биомассы B j и количества особей N j

представляют собой векторы

биомассы и численности для заданного числа n j

классов по

биомассе. Значения индекса

j в модели меняются от 1 до 6: j =1 относится к сардине

(Sardina pilchardus); j = 2 –

к круглой сардинелле (Sardinella aurata); j = 3 –

к плоской

сардинелле (Sardinella maderensis); j = 4 – к европейской ставриде (Trachurus trachurus); j = 5 – к западноафриканской ставриде (Trachurus trecae) и j = 6 – к восточной скумбрии

(Scomber colias). Динамика переменных B j и N j

задается в модели следующей системой

эволюционных уравнений:

 

 

d

 

B j

= (G j M j + O j

+ τ j ) B j ;

(1)

 

dt

 

 

 

 

 

 

 

d

 

N j

= −M j N j + (τNj

+ ONj ) B j ,

(2)

 

dt

 

 

 

 

 

 

 

где

152

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

 

 

 

 

B j

 

 

 

 

N j

 

 

 

 

 

1

 

 

 

 

 

1

 

 

B

j

=

 

 

 

, N

j

=

 

 

 

(3)

 

 

 

 

 

 

 

.

 

 

 

B j

 

 

 

N j

 

 

 

 

 

 

n j

 

 

 

 

n j

 

 

 

Скумбрия

 

 

 

восточная

 

 

 

Scomber colias

 

 

 

Cтаврида

 

 

 

западноафриканская

 

 

 

Trachurus trecae

 

 

 

Cтаврида

 

 

 

европейская

 

 

 

Trachurus trachurus

 

 

 

Cардина

Сардинелла плоская

 

Sardina pilchardus

Sardinella maderensis

D

 

 

 

 

 

 

Сардинелла круглая

N

P

Z

Sardinella aurata

Рисунок 1. Модельная структура пищевой цепи рыб в районе зоны апвеллинга ЦВА.

В формуле (1) диагональные матрицы G j задают эффективные скорости роста рыб, которые рассчитываются в зависимости от максимальных скоростей роста (с коррекцией их значений на температурные условия), лимитирующих функций на условия питания в данный момент времени, трат на обменные метаболические процессы и перехода в детрит части потребленной рыбами пищи в результате процессов экскреции. В формулах (1), (2)

диагональные матрицы M j задают эффективные скорости смертности. При этом различают: фоновую скорость смертности; смертность, вызванную недостатком пищи; смертность, обусловленную конкурентными взаимодействиями между рыбами по типу «жертва– хищник»; промысловую смертность, обусловленную выловом рыбы промысловыми судами.

В формулах (1) (2) матрицы O j и ONj , j =1,6 в модели задают скорости воспроизводства потомства (пополнения; роста биомассы). Для биомассы B j и количества особей N j , j =1,6 матрицы скорости перехода τ j и τNj задают переход рыб из одного размерного (по массе)

класса в другой, который осуществляется дискретно во времени (если средняя индивидуальная масса рыбы достигнет верхнего заданного для класса i предела биомассы).

Литература

Доманевский Л.Н. Рыбы и рыболовство в неретической зоне Центрально-Восточной Атлантики. – Калининград: АтлантНИРО, 1998. – 195 с.

Подгорный К.А. Исследование свойств пространственно однородной математической модели четырехкомпонентной планктонной системы // Математическая биология и биоинформатика, 2012, т. 7, №1, стр. 299–321.

Fennel W. Towards bridging biogeochemical and fish-production models // Journal of Marine Systems, 2008, v. 71, p. 171–194.

Fennel W. Parameterizations of truncated food web models from the perspective of an end-to-end model approach // Journal of Marine Systems, 2009, v. 77, p. 171–185.

Fennel W. A nutrient to fish model for the example of the Baltic Sea// Journal of Marine Systems, 2010, v. 81, p. 184– 195.

153

Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия

Radtke H., Neumann T., Fennel W. A Eulerian nutrient to fish model of the Baltic Sea — A feasibility-study // Journal of Marine Systems, 2013, v. 125, p. 61–76.

154