Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ivanter2000_vved_v_kolich_biol

.pdf
Скачиваний:
16
Добавлен:
14.04.2015
Размер:
3.42 Mб
Скачать

Ивантер Эрнест Викторович Коросов Андрей Викторович

Введение в количественную биологию

Петрозаводск

2000

ВВЕДЕНИЕ

В процессе любых научных, особенно экспериментальных, исследований, как и во всех областях прикладной биологии (медицине, агробиологии, селекции, охотоведении, лесоводстве, биотехнологии и т. д.), мы всегда имеем дело с цифрами – данными о размерах, весе, возрасте, плодовитости организмов, продуктивности экосистем, урожайности сортов, соотношении между признаками, дозами факторов, различными диагностическими и иными тестами и прочими количественными показателями и числовыми характеристиками. За кажущимся хаосом этих цифр прячутся конкретные закономерности, которые требуют объективной оценки и научного объяснения. И здесь самое широкое применение находят разнообразные методы и приемы биометрии – вариационной статистики, призванной с помощью соответствующего математического аппарата оценить разнообразные связи, зависимости и отношения между биологическими явлениями, объектами и процессами, а также показать реальность их существования.

Биометрия представляет собой инструмент, способный выразить в числе и измерить значимость и надежность полученных результатов, заранее рассчитать и спланировать необходимую численность объектов для того или иного эксперимента, оценить достоверность проверяемой в эксперименте гипотезы, по части охарактеризовать целое, получить точную количественную характеристику изменчивости исследуемого показателя, определить степень и характер различий между признаками и процессами, выделить из множества воздействующих на явление факторов наиболее важные, измерить силу их влияния. Методологией количественной биологии является отделение случайного от закономерного, доказательство существования закономерного в видимом хаосе изменчивости. Это достигается посредством множества методов прикладного статистического анализа, основанных на знании закономерностей поведения случайных величин.

4

Игнорирование и недооценка статистической обработки полученного исследователем материала может свести на нет результаты многих важных опытов, привести к необоснованным или даже ошибочным заключениям. Напротив, умелое применение биометрических методов увеличивает информативную ценность проведенного исследования, обогащает экспериментатора новыми знаниями, помогает правильно планировать постановку опытов, глубоко разбираться в полученных данных, объективно оценивать результаты массовых наблюдений, выявлять скрытые закономерности и правильно их трактовать, что в конечном итоге делает биологию точной наукой.

При этом следует иметь в виду, что сама по себе статистическая обработка данных, как бы ни была она совершенна с точки зрения математики, не может служить гарантией качественности выполненного биологом исследования и не способна обеспечить надежности полученных им результатов, если само исследование проведено неправильно или использованные данные ошибочны. Более того, формальное применение математических методов, без понимания их сути и приложимости к тем или иным биологическим явлениям, и вообще злоупотребление вариационной статистикой, слепое использование ее, даже когда в этом нет никакой необходимости, может принести только вред. В работе биолога одинаково недопустимы как математический фетишизм, подмена биологических методов математическими, так и недооценка вариационностатистических приемов и принижение роли математической обработки.

Составляя настоящее руководство, мы попытались в возможно более простой и максимально краткой форме изложить элементарные основы количественной биологии, разъяснить суть и назначение вариационно-статистической обработки количественных данных, помочь начинающему исследователю, не имеющему специальной математической подготовки, сознательно применять общедоступные методы биометрического исследования, познакомить его с порядком и способами расчета основных статистических показателей и принципами их биологической интерпретации. В книге обсуждаются возможности и перспективы применения различных статистических приемов, их достоинства и формы использования в повседневной

5

практике биологических исследований. Сознательно отказавшись от строгого изложения математических аспектов теории биометрии, подробного объяснения и вывода сложных расчетных формул, мы сконцентрировали внимание на необходимом минимуме статистических идей, помогающих понять принципы биометрического анализа массовых явлений и характерных биологических задач, и прежде всего на технике вычислений. Рассмотрены только те статистические методы, которые авторы достаточно широко применяли в своих биолого-экологических исследованиях и на личном опыте убедились в их эффективности. Другие методы статистического исследования приведены в специальных пособиях по вариационной статистике; некоторые из них указаны в списке рекомендуемой литературы. Приемы изучения временных рядов нами не рассматриваются, поскольку требуют отдельного издания.

Для каждого метода приведен алгоритм ручного счета и примеры использования с этой целью пакета Microsoft Excel. Это приложение ЭВМ настолько упрощает количественное исследование, включая решение статистических задач и моделирование, что нельзя было обойти его молчанием. Наша книга во многом ориентирована на использование этого пакета и содержит примеры работы в среде MS Excel. Для решения некоторых сложных задач требуется более мощный пакет статистических расчетов, такой как StatGraphics for Windows версии 2.2 или 3, применение которого также кратко рассмотрено в ряде разделов. Этот пакет выполняет полный набор мыслимых методов статистических обработки, но при этом, в отличие от известных программ Statistica и SPSS, имеет исключительно простой и удобный интерфейс, а также небольшой объем. Он немного уступает им в графических возможностях, но для унификации способов оформления отчетов (публикаций) все равно лучше использовать графические возможности Excel, в среду которого следует импортировать результаты обработки из StatGraphics или других пакетов.

В конце книги приведены справочные таблицы, необходимые для статистической обработки данных, и предметный указатель.

6

1

ПРИНЦИПЫ КОЛИЧЕСТВЕННОЙ БИОЛОГИИ

Основные задачи количественной биологии

Биометрия – это инструмент эмпирического познания природы, в отличие от математической биологии, исследующей теоретические проблемы с помощью аналитического моделирования.

Методы количественной биологии (биометрия) призваны конкретизировать отображение биологических фактов, придать строгость биологическим выводам и прогнозам, способствовать целенаправленному исследованию биологических феноменов. Можно говорить о четырех основных задачах количественной биологии.

1.Задача количественного представления биологических фактов (измерение и сокращение размерности) – выразить свойства отдельного биологического объекта измерения в виде числа, варианты, значения переменной.

2.Задача обобщенного описания множества фактов (статистическое оценивание) – рассчитать показатели, параметры, которые полноценно отражают свойства множества однотипных объектов измерения, свойства выборки.

3.Задача поиска закономерностей (проверка статистических гипотез) – доказать неслучайность отличий между сравниваемыми совокупностями, объектами, реальность зависимости их характеристик от неких внешних или внутренних причин.

4.Задача исследования процессов (динамическое имитационное моделирование) – объяснить ход природного процесса множеством специфических отношений (выраженных уравнениями) между переменными биологического объекта и

среды.

Для решения каждой из этих задач предлагаются достаточно простые, но эффективные способы, рассмотренные ниже. Большинство из них не требует использования даже калькулятора, хотя проще всего все расчеты проводить в среде пакета MS Excel.

7

Модель

Биометрические методы, рассматриваемые ниже, предлагают исследователю различные модели действительности, с помощью которых можно решать биометрические задачи разной сложности. В слове "модель" заключено только одно содержание: все, что мы думаем о действительности не есть действительность, но только ее отражение в нашем сознании, слепок, подобие, модель. Мысль о природе есть ее модель.

Число – это тоже модель, способ мышления о существенных чертах объектов, отбор из бесчисленного множества его свойств лишь некоторых с указанием того или иного числового значения.

Модели в виде простой формулы часто используются в иллюстративных целях для краткого выражения неких общих мыслей. Таковы понятийные модели варианты, на которых основаны разного рода статистические методы, рассмотренные ниже.

Для строгого описания действительности статистическая теория предлагает множество математических моделей. Центральной моделью выступает "закон нормального распределения" – функция, описывающая специфическое соотношение между значениями (плотностью) непрерывной случайной величины (t) и частотой (вероятностью) встречаемости ее значений (p):

 

 

1

 

 

t 2

p

 

 

e

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

Когда говорят, что данный признак имеет нормальное распределение, подразумевается, что "стохастическое поведение" этой случайной величины очень хорошо описывается (аппроксимируется) приведенной формулой. Практика показывает, что эта формула подходит к очень большому числу количественных характеристик. Модель нормального распределения чаще других используют для описания случайных событий. Ее применение (предположение о "нормальности" изучаемых признаков) дает в руки исследователябиолога множество полезных и удобных инструментов решения биологических задач. Это и интервальная оценка для прогноза ожидаемых значений случайной величины, и метод расчета наиболее теоретически обоснованных общих характеристик выборки (средних,

8

дисперсий) и показателей сопряженной изменчивости разных признаков (корреляции), и пр. На идее нормального распределения базируются конструкции всевозможных статистических критериев для сравнения параметров разных выборок и проверки статистических гипотез. Кроме нормального закона статистической наукой обнаружены другие виды поведения случайных величин, которые основаны либо на том или ином допущении о нарушении условий формирования нормального закона, либо на специфическом преобразовании случайной величины, исходно распределенной нормально.

Этапы биометрического исследования

Биология по большей части остается наукой эмпирической: сбор фактов в поисках закономерностей проявления природных феноменов доминирует над объяснением существа этих процессов, построением теории (особенно количественной) и прогноза. Поиски "закономерностей" в биологии явно превалируют на поисками "законов", в первом случае говорят об эмпирической (индуктивной) науке, во втором – о теоретической (дедуктивной). Методы, рассмотренные в книге, обслуживают потребности первого научного направления. При этом сохраняется надежда, что законы биологии вырастут из обнаруженных закономерностей.

Математическая статистика, исследующая массовые проявления, служит средством доказательства существования той или иной закономерности, причинной обусловленности серии фактов. Факт сам по себе, раз случился, достоверен. Доказывать приходится достоверность существования причин, вызвавших факты к жизни и тем самым обеспечивающих их общность. Если наличие некоей причины обуславливает однотипность протекания биологических процессов, вызывает повторные появления сходных результатов, говорят о обнаружении закономерности. Закономерное – это повторяющееся, причем в зависимости от известных условий (причин). Биометрия представляет способы доказательства реальности эмпирических закономерностей.

Они служат необходимым средством достижения биологом своих целей, установленных исходя из существа биологической

9

проблемы. В этом смысле для биометрического исследования очень важна точная формулировка биологического вопроса.

Мало обнаружить закономерность, необходимо еще и показать ее реальность, а для этого – оценить количественно. Статистический анализ как раз и служит этой двойной задаче: во-первых, численно охарактеризовать биологический объект, явление или процесс, его масштабы и тенденции и, во-вторых, доказать объективность его существования, специфичность, достоверность отличия от других явлений или процессов. Опираясь на полученный научный материал, статистика способна доказать несостоятельность выдвинутых гипотез, отделить, как зерна от плевел, истинные отличия от случайных, привнесенных неучтенными факторами, вычленить реальную закономерность из обилия сырого экспериментального материала.

К сожалению, исследователи зачастую подменяют цели исследования средствами их решения, что понятно из такого типичного вопроса: "Вот мои данные, как их нужно статистически обработать?" Конструктивный диалог может начаться только после ответа на другой вопрос, зачем эти данные нужно как-то обрабатывать, зачем вообще они были собраны? Нам кажется, что такой диалог должен быть внутренним и обязан предварять не столько обработку, сколько сбор данных. Как писал отец эмпирической науки Ф. Бэкон, "правильно поставленный вопрос есть половина ответа". Цель исследования организует его. Спланировать способ обработки нужно перед сбором фактических данных!

Ввиду очевидной сложности этого процесса, рассмотрим его основные этапы эмпирического исследования.

1.Определить объект исследования. Объект исследования – это не вид животного или растения, это исследуемый феномен со всеми относящимися к делу внешними компонентами, включая пространство (распространение) и время (динамика). Объектом биологии выступает жизнь, процессы жизнедеятельности, функционирования биосистем. Объектом частного биологического исследования выступает ограниченная во времени и пространстве биосистема. В частности, даже "фауна N-го района" понятие динамическое.

2.Определить проблему и актуальность исследования.

Проблема ("Что плохо?") в научном плане есть отсутствие знаний об

10

объекте исследования в определенной области его биологии. Потребность в недостающей информации появляется в том случае, когда уже имеются некоторые данные, обрисовывающие границы известного и обнажающие края неизвестного. Актуальность формулируется в терминах уже известного по отношению к еще неизвестному знанию. Приступая к исследованию фауны некоей территории, заранее понятно, что кто-то на ней живет, но кто именно и

вкаких количествах – остается пока неизвестным.

3.Определить цель исследования. Цель ("Чего хочется?") в

обобщенном виде характеризует итог исследования. Например, изучить видовой состав и численность животных на определенной территории в определенный временной промежуток есть общая цель фаунистического исследования. Только на этом фоне возможны обобщения на больших территориях и временах, т. е. обнаружение неких общих закономерностей. Научная деятельность не может не быть целесообразной, она должна вести к определенной цели. Она определяет шаги исследования, выбор средств и методов, планирование трудовых и финансовых затрат. Цель служит постоянным критерием эффективности выполненных действий, основой рефлексии, ограничителем.

4.Определить задачи исследования. Задачами ("Что сделать?") отмечаются шаги к цели, это мост между ней и конкретными средствами ее достижения. Задачи могут быть как научного толка (тогда они предписывают конкретные действия, позволяющие решить частный вопрос специфическими методами), так и методические (определяющие пути разработки недостающих методических приемов работы или развитие инструментальной базы). Задачи – это руководства к действию, указания, как делать и что будет получено в результате, если предпринять такие-то действия.

Именно на этом этапе становится ясным, какими должны быть массивы собираемой количественной информации, вид количественных характеристик (переменных), их число, способы регистрации статуса объектов измерения и факторов среды, схемы опытов и т. п. Знание этих частностей необходимо, чтобы запланировать использование того или иного статистического анализа, предъявляющего свои требования к исходным данным. Точнее всего работают параметрические методы, но они требуют регистрации

11

количественной информации в форме рациональных или натуральных чисел. Если же запланировать получение характеристик объектов в приблизительных полуколичественных шкалах (баллы, ранги) или вообще с помощью только качественных признаков, то следует помнить, что в конце концов придется пользоваться более грубыми непараметрическими методами статистики.

Понятно, что разработка задач требует от автора предметного знания и опыта аналогичной работы. В реальности практически никогда не удается сделать все, что запланировано, но часто удается получить важные побочные результаты помимо требуемых. Это заставляет переформулировать дефиниции проблемы, целей и задач, увязывая части исследования в целостную систему. Подобная итерация, повторное переосмысление и переработка теоретических и методических основ исследования – норма научной работы.

5.Сбор и накопление данных, изучение биологического явления. При сборе данных важно помнить правило "единообразия и равновероятности" собираемых выборок, чтобы свести к минимуму субъективные и систематические ошибки, уменьшающие точность измерений. Это условие относится к способу формирования выборок, суть которого заключается в создании одинаковых условий наблюдения и обеспечении равной вероятности получаемых результатов: каждая варианта должна иметь возможность представлять весь спектр действующих факторов без ограничений; в противном случае состав выборки будет не гомогенным, и статистические законы будут проявляться "неправильно", что сделает невозможным применение точных статистических критериев.

6.Решение биометрической задачи. Статистика решает узкий круг задач, которые не подменяют более широкие функции биологического исследования, но зато требуют жесткой определенности формулировок. Чтобы добиться требуемой строгости, исходно рыхлое словесное описание биологического вопроса предварительно необходимо перевести на язык методов статистики, после чего выполнить расчетные процедуры и в завершение получить требуемый ответ. Процедура решения биометрической задачи включает несколько последовательных этапов; в из числе:

конкретизация

формализация

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]