
- •Введение
- •Принципы количественной биологии Основные задачи количественной биологии
- •Этапы биометрического исследования
- •Выборка и ее статистическое описание
- •Процесс формирования выборки
- •Признак
- •Построение вариационного ряда
- •Средняя (характеристика величины признака)
- •Стандартное отклонение (и другие показатели изменчивости)
- •Статистическое оценивание Свойства нормального распределения
- •Генеральная совокупность и выборка
- •Ошибка репрезентативности выборочных параметров
- •Доверительный интервал
- •Определение точности опыта
- •Оптимальный объем выборки
- •Асимметрия и эксцесс
- •Основные типы распределения биологических признаков
- •Нормальное распределение
- •Биномиальное распределение
- •Распределение Пуассона
- •Альтернативное распределение
- •Полиномиальное распределение
- •Равномерное распределение
- •Проверка статистических гипотез
- •Задача "доказать чужеродность варианты"
- •Задача "доказать отличие двух выборок"
- •Сравнение двух выборок по величине признака
- •Сравнение средних арифметических по критерию t Стьюдента
- •Сравнение двух выборок по изменчивости признака
- •Сравнение стандартных отклонений по критерию t Стьюдента
- •Сравнение дисперсий по критерию f Фишера
- •Сравнение коэффициентов вариации по критерию t Стьюдента
- •Сравнение двух выборок в целом (непараметрические критерии)
- •Критерий u Уилкоксона – Манна – Уитни
- •Критерий т Уайта
- •Критерий q Розенбаума
- •Сравнение двух выборок по силе корреляции двух признаков
- •Сравнение двух линий регрессии
- •Сравнение двух выборок по характеру распределения
- •Критерий χ² Пирсона
- •Критерий Колмогорова – Смирнова
- •Отношения между статистиками t, t, f и χ²
- •Задача "доказать отличие нескольких выборок" ("доказать влияние фактора")
- •Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ)
- •Логико-теоретические основы
- •Техника расчетов
- •Дисперсионный анализ для количественных признаков
- •Парные сравнения выборочных средних методом Шеффе
- •Сравнение нескольких выборок по изменчивости признака
- •Сравнение нескольких выборок по величине двух признаков (двухфакторный дисперсионный анализ)
- •Логико-теоретические основы
- •Техника расчетов
- •Задача "найти зависимость между двумя признаками"
- •Регрессионный анализ зависимости двух признаков
- •Логико-теоретические основы
- •Техника расчета линейной регрессии
- •Криволинейная регрессия
- •Корреляционный анализ
- •Логико-теоретические основы
- •Биологическая интерпретация коэффициента корреляции
- •Техника расчета линейного коэффициента корреляции
- •Ложная корреляция
- •Метод множественной корреляции
- •Метод частной корреляции
- •Корреляционное отношение и критерий линейности
- •Ранговый коэффициент корреляции Спирмена
- •Корреляция между качественными признаками
- •Задача "классифицировать объекты" Методы многомерного анализа
- •Основы кластерного анализа
- •Основы дискриминантного анализа
- •Основы метода главных компонент
- •Главные компоненты как факторы
- •Требование максимума дисперсии
- •Факторные нагрузки
- •Расчет корреляционных компонент
- •Требование ортогональности компонент
- •Компонентный анализ
- •Информативность и значимость компонент
- •Этапы компонентного анализа
- •Варианты представления результатов
- •Компонентный анализ в среде StatGraphics
- •Имитационное моделирование в среде Excel
- •Задача аппроксимации данных (статические модели)
- •Задача изучения процессов (динамические модели)
- •Приемы работы в Excel
- •Литература
- •Справочные таблицы
- •Квадраты и квадратные корни для чисел 1…99
- •Значения случайных чисел равномерно распределенных на интервале (0, 1)
- •Ординаты нормальной кривой (значения функции )
- •Значение критерия t для отбраковки "выскакивающих" вариант
- •Пороговые значения распределения т Стьюдента; α для двустороннего критерия
- •Значения критерия Стьюдента
- •Значения критерия χ²
- •Значения критерия u Уилкоксона – Манна – Уитни
- •Значения критерия q Розенбаума
- •Значения величины
- •Содержание
- •Ивантер Эрнест Викторович Коросов Андрей Викторович Введение в количественную биологию
Выборка и ее статистическое описание
Биометрическое исследование в центр внимания всегда ставит выборку. В статистическом смысле выборка – набор чисел, множество значений случайной величины, совокупность вариант; отдельная варианта – это число. С предметной стороны, варианта предстает как объект, носитель числа, а выборка – как группа объектов. В процессе формирования выборки участвует несколько агентов, которые необходимо иметь в виду для правильной интерпретации различий между выборками. Основная особенность выборки как множества значений случайной величины – это отличие отдельных вариант друг от друга, явление изменчивости.
Процесс формирования выборки
В поисках причин варьирования детально рассмотрим отдельную варианту, единичное значение – число.
Для понимания структурно-логической сущности числа в биометрическом исследовании требуется привлечение как минимум четырех понятий: объект, признак, фактор, метод; вместе они образуют элементарный фрейм, логическую структуру минимального размера, необходимую для понимания существа процесса появления выборки.
Число есть количественное выражение признака некоего объекта, полученного при данном уровне фактора внешней среды вполне определенным методом. С помощью этого фрейма очень просто показать основные направления тиражирования чисел, т. е. набора множества вариант, формирующих выборки, а также основные трудности с этим связанные.
Метод
Процедура получения чисел (вариант), включающая субъекта, методику, инструмент их измерения и регистрацию. Простейший способ получения выборки – использование разных методов измерения одного и того же объекта. В этом случае отличия повторных примеров будут характеризовать разнокачественность применяемых методик, инструментов или уровни навыка участвующих исполнителей. При этом разные методы обладают разной способностью сообщить вариантам случайные ошибки (неточность оценок) и систематические ошибки (смещение оценок). По этой причине те выборки, варианты которых получены разными методами, обладают заведомо большей изменчивостью, чем выборки методически однородные. Рассмотренная тема приводит к очевидной рекомендации – для формирования сравнимых выборок использовать единую методику, одинаковый инструмент, "одни руки"; это, впрочем, далеко не всегда возможно.
Приступая к составлению выборки, метод ее получения следует соотнести с теми статистическими методами, что планируются для анализа количественных материалов, – не исключено, что выбранная процедура измерений не годится для формирования корректных выборок. Грубые методы (оценки "на глаз") позволяют дать только грубые оценки – качественные, или баллы; точные инструментальные методы позволяют получать гораздо более эффективные характеристики в форме непрерывных признаков, дробных чисел. В частности, балльные оценки можно статистически исследовать только с помощью непараметрических приемов, тогда как для непрерывных количественных признаков можно использовать, кроме того, точные и высокоэффективные параметрические методы.
Важно отметить, что точность инструмента измерения и точность метода измерения – разные понятия. В первом случае говорят о технической характеристике. Под точностью метода подразумевается понятие точности (погрешности) измерительной процедуры, т. е. возможность воспроизведения тех же результатов при повторном измерении одного и того же объекта. Помимо точности (состояния) прибора здесь фигурируют еще и навыки исследователя, и точность инструкции, и особенности условий проведения измерений (влажность, радиация и др.). Можно поэтому утверждать, что точность метода всегда ниже, чем точность инструмента. Это значит, что биологам нет смысла проводить измерения очень точными приборами, если сама процедура измерения предполагает широкое варьирование. В частности, длина тела мелких млекопитающих многими зоологами измеряется штангенциркулем. Во время измерения зверек лежит на столе. При этом у зверьков, попавших в давилки недавно, еще не проходит трупное окоченение, и их позвоночник физически невозможно "распрямить", тогда как мышцы немного "лежалых" зверьков расслабляются и позвоночник выпрямить просто. Промеры зверьков "разной свежести" обязательно дадут отличающиеся результаты с погрешностью 1–2 мм. Зачем в таком случае использовать штангенциркуль с ценой деления 0.1 мм, если удобнее (проще и быстрее) проводить измерения этих мелких животных на миллиметровой бумаге? На наш взгляд, точность измерительного инструмента (и трудоемкость измерения) должна быть соотнесена с погрешностью самой процедуры измерения. В любом случае выбор в пользу того или иного метода регистрации вариант (чисел) требует предварительной оценки их погрешности (причем разными исполнителями, дабы не превращать науку в искусство).