
- •Введение
- •Принципы количественной биологии Основные задачи количественной биологии
- •Этапы биометрического исследования
- •Выборка и ее статистическое описание
- •Процесс формирования выборки
- •Признак
- •Построение вариационного ряда
- •Средняя (характеристика величины признака)
- •Стандартное отклонение (и другие показатели изменчивости)
- •Статистическое оценивание Свойства нормального распределения
- •Генеральная совокупность и выборка
- •Ошибка репрезентативности выборочных параметров
- •Доверительный интервал
- •Определение точности опыта
- •Оптимальный объем выборки
- •Асимметрия и эксцесс
- •Основные типы распределения биологических признаков
- •Нормальное распределение
- •Биномиальное распределение
- •Распределение Пуассона
- •Альтернативное распределение
- •Полиномиальное распределение
- •Равномерное распределение
- •Проверка статистических гипотез
- •Задача "доказать чужеродность варианты"
- •Задача "доказать отличие двух выборок"
- •Сравнение двух выборок по величине признака
- •Сравнение средних арифметических по критерию t Стьюдента
- •Сравнение двух выборок по изменчивости признака
- •Сравнение стандартных отклонений по критерию t Стьюдента
- •Сравнение дисперсий по критерию f Фишера
- •Сравнение коэффициентов вариации по критерию t Стьюдента
- •Сравнение двух выборок в целом (непараметрические критерии)
- •Критерий u Уилкоксона – Манна – Уитни
- •Критерий т Уайта
- •Критерий q Розенбаума
- •Сравнение двух выборок по силе корреляции двух признаков
- •Сравнение двух линий регрессии
- •Сравнение двух выборок по характеру распределения
- •Критерий χ² Пирсона
- •Критерий Колмогорова – Смирнова
- •Отношения между статистиками t, t, f и χ²
- •Задача "доказать отличие нескольких выборок" ("доказать влияние фактора")
- •Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ)
- •Логико-теоретические основы
- •Техника расчетов
- •Дисперсионный анализ для количественных признаков
- •Парные сравнения выборочных средних методом Шеффе
- •Сравнение нескольких выборок по изменчивости признака
- •Сравнение нескольких выборок по величине двух признаков (двухфакторный дисперсионный анализ)
- •Логико-теоретические основы
- •Техника расчетов
- •Задача "найти зависимость между двумя признаками"
- •Регрессионный анализ зависимости двух признаков
- •Логико-теоретические основы
- •Техника расчета линейной регрессии
- •Криволинейная регрессия
- •Корреляционный анализ
- •Логико-теоретические основы
- •Биологическая интерпретация коэффициента корреляции
- •Техника расчета линейного коэффициента корреляции
- •Ложная корреляция
- •Метод множественной корреляции
- •Метод частной корреляции
- •Корреляционное отношение и критерий линейности
- •Ранговый коэффициент корреляции Спирмена
- •Корреляция между качественными признаками
- •Задача "классифицировать объекты" Методы многомерного анализа
- •Основы кластерного анализа
- •Основы дискриминантного анализа
- •Основы метода главных компонент
- •Главные компоненты как факторы
- •Требование максимума дисперсии
- •Факторные нагрузки
- •Расчет корреляционных компонент
- •Требование ортогональности компонент
- •Компонентный анализ
- •Информативность и значимость компонент
- •Этапы компонентного анализа
- •Варианты представления результатов
- •Компонентный анализ в среде StatGraphics
- •Имитационное моделирование в среде Excel
- •Задача аппроксимации данных (статические модели)
- •Задача изучения процессов (динамические модели)
- •Приемы работы в Excel
- •Литература
- •Справочные таблицы
- •Квадраты и квадратные корни для чисел 1…99
- •Значения случайных чисел равномерно распределенных на интервале (0, 1)
- •Ординаты нормальной кривой (значения функции )
- •Значение критерия t для отбраковки "выскакивающих" вариант
- •Пороговые значения распределения т Стьюдента; α для двустороннего критерия
- •Значения критерия Стьюдента
- •Значения критерия χ²
- •Значения критерия u Уилкоксона – Манна – Уитни
- •Значения критерия q Розенбаума
- •Значения величины
- •Содержание
- •Ивантер Эрнест Викторович Коросов Андрей Викторович Введение в количественную биологию
Введение
В процессе любых научных, особенно экспериментальных, исследований, как и во всех областях прикладной биологии (медицине, агробиологии, селекции, охотоведении, лесоводстве, биотехнологии и т. д.), мы всегда имеем дело с цифрами – данными о размерах, весе, возрасте, плодовитости организмов, продуктивности экосистем, урожайности сортов, соотношении между признаками, дозами факторов, различными диагностическими и иными тестами и прочими количественными показателями и числовыми характеристиками. За кажущимся хаосом этих цифр прячутся конкретные закономерности, которые требуют объективной оценки и научного объяснения. И здесь самое широкое применение находят разнообразные методы и приемы биометрии – вариационной статистики, призванной с помощью соответствующего математического аппарата оценить разнообразные связи, зависимости и отношения между биологическими явлениями, объектами и процессами, а также показать реальность их существования.
Биометрия представляет собой инструмент, способный выразить в числе и измерить значимость и надежность полученных результатов, заранее рассчитать и спланировать необходимую численность объектов для того или иного эксперимента, оценить достоверность проверяемой в эксперименте гипотезы, по части охарактеризовать целое, получить точную количественную характеристику изменчивости исследуемого показателя, определить степень и характер различий между признаками и процессами, выделить из множества воздействующих на явление факторов наиболее важные, измерить силу их влияния. Методологией количественной биологии является отделение случайного от закономерного, доказательство существования закономерного в видимом хаосе изменчивости. Это достигается посредством множества методов прикладного статистического анализа, основанных на знании закономерностей поведения случайных величин.
Игнорирование и недооценка статистической обработки полученного исследователем материала может свести на нет результаты многих важных опытов, привести к необоснованным или даже ошибочным заключениям. Напротив, умелое применение биометрических методов увеличивает информативную ценность проведенного исследования, обогащает экспериментатора новыми знаниями, помогает правильно планировать постановку опытов, глубоко разбираться в полученных данных, объективно оценивать результаты массовых наблюдений, выявлять скрытые закономерности и правильно их трактовать, что в конечном итоге делает биологию точной наукой.
При этом следует иметь в виду, что сама по себе статистическая обработка данных, как бы ни была она совершенна с точки зрения математики, не может служить гарантией качественности выполненного биологом исследования и не способна обеспечить надежности полученных им результатов, если само исследование проведено неправильно или использованные данные ошибочны. Более того, формальное применение математических методов, без понимания их сути и приложимости к тем или иным биологическим явлениям, и вообще злоупотребление вариационной статистикой, слепое использование ее, даже когда в этом нет никакой необходимости, может принести только вред. В работе биолога одинаково недопустимы как математический фетишизм, подмена биологических методов математическими, так и недооценка вариационно-статистических приемов и принижение роли математической обработки.
Составляя настоящее руководство, мы попытались в возможно более простой и максимально краткой форме изложить элементарные основы количественной биологии, разъяснить суть и назначение вариационно-статистической обработки количественных данных, помочь начинающему исследователю, не имеющему специальной математической подготовки, сознательно применять общедоступные методы биометрического исследования, познакомить его с порядком и способами расчета основных статистических показателей и принципами их биологической интерпретации. В книге обсуждаются возможности и перспективы применения различных статистических приемов, их достоинства и формы использования в повседневной практике биологических исследований. Сознательно отказавшись от строгого изложения математических аспектов теории биометрии, подробного объяснения и вывода сложных расчетных формул, мы сконцентрировали внимание на необходимом минимуме статистических идей, помогающих понять принципы биометрического анализа массовых явлений и характерных биологических задач, и прежде всего на технике вычислений. Рассмотрены только те статистические методы, которые авторы достаточно широко применяли в своих биолого-экологических исследованиях и на личном опыте убедились в их эффективности. Другие методы статистического исследования приведены в специальных пособиях по вариационной статистике; некоторые из них указаны в списке рекомендуемой литературы. Приемы изучения временных рядов нами не рассматриваются, поскольку требуют отдельного издания.
Для каждого метода приведен алгоритм ручного счета и примеры использования с этой целью пакета Microsoft Excel. Это приложение ЭВМ настолько упрощает количественное исследование, включая решение статистических задач и моделирование, что нельзя было обойти его молчанием. Наша книга во многом ориентирована на использование этого пакета и содержит примеры работы в среде MS Excel. Для решения некоторых сложных задач требуется более мощный пакет статистических расчетов, такой как StatGraphics for Windows версии 2.2 или 3, применение которого также кратко рассмотрено в ряде разделов. Этот пакет выполняет полный набор мыслимых методов статистических обработки, но при этом, в отличие от известных программ Statistica и SPSS, имеет исключительно простой и удобный интерфейс, а также небольшой объем. Он немного уступает им в графических возможностях, но для унификации способов оформления отчетов (публикаций) все равно лучше использовать графические возможности Excel, в среду которого следует импортировать результаты обработки из StatGraphics или других пакетов.
В конце книги приведены справочные таблицы, необходимые для статистической обработки данных, и предметный указатель.
1